Item talk:Q467586

From FactGrid
Revision as of 00:32, 10 December 2022 by Olaf Simons (talk | contribs)
Jump to navigation Jump to search

FactGrid Import, Arbeitsbericht

Ausgangspunkt des Dateninputs, der Ende November, Angang Dezember 2022 von mir durchgeführt wurde war die folgende Ausgangsdatei, hier erweitert mit einer Spalte A, die Links zu den angelegten Datenbankobjekten liefert:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die einzelnen Spalten wurden weitgehend übernommen. Die Blätter "Untergliedernde Items anlegen" und "nicht importierte URL-Angaben" bieten die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe hat, respektive aus Kaliope aktuelle Information verlinken.

Anlage der primären Datenbankobjekte

Die ersten Arbeitsschritte waren:

  • Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie Item:Q457158 ohne Titel, hier generierte ich einen provisorisches "Label" aus in anderen Zellen gegebenen Informationen)
  • P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
  • P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
  • P329+P10 die Angabe des aktuellen Standorts mit Signatur
  • P135 + Item:Q467586, die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
https://tinyurl.com/2lxfgew4

Die Ausgangstabelle kann nun in FactGrid Datenbankabfragen generiert werden, wobei es sich nicht empfiehlt eine Gesamt-Tabelle zu erstellen. Klüger ist es nach Bedarf Abfragen zusammenzustellen und die Ergebnisse dann im spezifischen Interesse herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) misslich.

Personen

Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von Item:Q456648:


Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen (Beteiligte) mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.

Diese Datenanlage bleibt unbefriedigend, da wir hier trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, wie die Beteiligten zueinander stehen. Aus der Erschließung ging nicht hervor welcher Autor wem schrieb oder von wem Post erhielt, doch kann man nun zumindest erfassen, wo sich Materialen an eine Person oder von ihr finden. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungszeiten.

Ortsbezüge

Die Ortsspalte der Ausgangstabelle (F) ist leider unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518, Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte

Die Informationen der Spalte K "Inhalt" sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden. Hier wäre es angeraten, die notierten Dokumente als einzelne Objekte anzulegen und entsprechend zu verlinken. Ich nahm davon Abstand, da es hier mittlerweile eine Kaliope Erfassung gibt, die klugerweise einzuarbeiten wäre.

Die übergangenen 62 Felder finden sich hier für die Nacharbeit gelistet: "Untergliedernde Items anlegen"

Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es spezifisch die Themen zu haben: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte kombiniert wie mit der Aussage: "Gymnasiale Sammlung - Handschrift, Brief".

Das FactGrid sieht hier zwei Properties mit spezifischen Referenzen vor (die ihrerseits dann in einem Ontologischen Gefüge unter Oberbegriffen stehen):

Hier war die Vorgabe nicht spezifisch genug in der thematischen Erschließung.

Literatur

Die Literaturangaben ließen sich isolieren ließen, sind jedoch im Moment ihrerseits nicht tiefer vernetzt, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. notierte im wesentlichen nur die Angaben in den Labeln. Bei Sammelwerken machte ich regelmäßig Einzelne Objekte für die Aufsätze und die jeweiligen Bände auf, in denen sie sich finden.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage gewiesen.

Entwicklungsrichtungen

Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 23:32, 9 December 2022 (CET)