Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
Line 99: Line 99:
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage spezifiziert.
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage spezifiziert.


== Entwicklungsrichtungen ==
== Potentiale ==


Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   
Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   


Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 23:32, 9 December 2022 (CET)
Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 23:32, 9 December 2022 (CET)

Revision as of 01:11, 10 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt des Dateninputs, den ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei, hier erweitert um die neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten liefert:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Die Blätter "Untergliedernde Items anlegen" und "nicht importierte URL-Angaben" bieten die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten indes obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe noch hat und zumeist in Kalliope hinein auf aktuelle Information verlinken.

Anlage der primären Datenbankobjekte

Die ersten Arbeitsschritte waren:

  • Zu jedem Objekt war eine Label anzulegen (es gab Gegenstände wie Item:Q457158 ohne Titel, in diesen Fällen generierte ich eine provisorisches Label aus in anderen Zellen gegebenen Informationen)
  • P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
  • P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
  • P329+P10 die Angabe des aktuellen Standorts mit Signatur
  • P135 + Item:Q467586, die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer (beliebig erweiterbaren) Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
https://tinyurl.com/2lxfgew4

Es empfiehlt sich nicht die ganze Ausgangstabelle in einer einzelnen Datenbankabfrage zu generieren (sie ist inhomogen, auch würde dies eine unübersichtliche Tabelle schaffen). Klüger ist es von nun an nach Bedarf Abfragen zusammenzustellen und deren Ergebnisse dann herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von Item:Q456648:


Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.

Die damit hergestellte Datenanlage bleibt jedoch erst einmal unbefriedigend, da wir trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, welche Verfasser etwa welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte der Ausgangstabelle (F) ist unspezifisch. Es wird aus ihr nicht ersichtlich, wann es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518, Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten.

Die übergangenen 62 Felder finden sich für diese Nacharbeit hier gelistet: "Untergliedernde Items anlegen"

Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es, die Themen möglichst spezifisch zu kennen: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte, zusammengesetzte Aussagen wie: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung im FactGrid von Interesse. Wir können uns die dezidierte Themenzuweisung leisten, da wir die Objekte wiederum in einer Klassifizierten Hierarchie der Kategorien führen, die sich ihrerseits in Suchen genereller Art hineinnehmen lässt.

Das FactGrid sieht keine Textfelder vor, sondern zwei Properties:

Literatur

Die Literaturangaben ließen sich isolieren, sind jedoch im Moment nicht tiefer ausgelotet, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. und überführte die Angaben nur in die Label. Bei Sammelwerken machte ich Objekte für die Aufsätze und die Objekte für die jeweiligen Bände auf, in denen sie sich finden und verlinkte entsprechend.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage spezifiziert.

Potentiale

Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 23:32, 9 December 2022 (CET)