Item talk:Q467586

From FactGrid
Jump to navigation Jump to search

FactGrid Import, Arbeitsbericht

Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
  • Im Blatt "nicht importierte Schlagworte" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.

Anlage der primären Datenbankobjekte

Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:

  • Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in Item:Q457158 ein provisorisches aus in anderen Zellen.
  • P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
  • P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
  • P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
  • P135 + Item:Q467586, verbindet alle Objekte mit der Projektkennung Item:Q467586, die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:
https://tinyurl.com/2lxfgew4

Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von Item:Q456648:

Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518. Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte / Schlagworte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "Untergliedernde Items anlegen".)

In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.

Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.

Konstruktiv wäre eine Bespielung der FactGrid Properties:

Literatur

Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.

Potentiale

Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 22:44, 11 December 2022 (CET)