Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
 
(7 intermediate revisions by the same user not shown)
Line 1: Line 1:
== FactGrid Import, Arbeitsbericht ==
== FactGrid Import, Arbeitsbericht ==


Ausgangspunkt des Dateninputs, den ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei, hier erweitert um die neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten liefert:
Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:


https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0
https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0


Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Die Blätter "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" und "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" bieten die ausgelassenen Importe.
Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.


* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten indes obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe noch hat und zumeist in Kalliope hinein auf aktuelle Information verlinken.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1135315606 nicht importierte Schlagworte]" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.


=== Anlage der primären Datenbankobjekte ===
=== Anlage der primären Datenbankobjekte ===


Die ersten Arbeitsschritte waren:
Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:
   
   
* Zu jedem Objekt war eine Label anzulegen (es gab Gegenstände wie [[Item:Q457158]] ohne Titel, in diesen Fällen generierte ich eine provisorisches Label aus in anderen Zellen gegebenen Informationen)
* Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in [[Item:Q457158]] ein provisorisches aus in anderen Zellen.
* P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
* P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
* P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
* P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
* P329+P10 die Angabe des aktuellen Standorts mit Signatur
* P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
* P135 + [[Item:Q467586]], die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer (beliebig erweiterbaren) Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
* P135 + [[Item:Q467586]], verbindet alle Objekte mit der Projektkennung [[Item:Q467586]], die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:


  https://tinyurl.com/2lxfgew4
  https://tinyurl.com/2lxfgew4


Es empfiehlt sich nicht die ganze Ausgangstabelle in einer einzelnen Datenbankabfrage zu generieren (sie ist inhomogen, auch würde dies eine unübersichtliche Tabelle schaffen). Klüger ist es von nun an nach Bedarf Abfragen zusammenzustellen und deren Ergebnisse dann herunterzuladen.
Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.


Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.
Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.
Line 28: Line 29:
=== Personen ===
=== Personen ===


Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von [[Item:Q456648]]:
Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von [[Item:Q456648]]:
 


  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]
  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]
Line 59: Line 59:
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797


Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.
Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.
 
Die damit hergestellte Datenanlage bleibt jedoch erst einmal unbefriedigend, da wir trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, welche Verfasser etwa welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.


=== Personen-Matching ===  
=== Personen-Matching ===  


Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.
Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.


Bei den Personen, die neu angelegt werden mussten, blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.
Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.


=== Ortsbezüge ===
=== Ortsbezüge ===


Die Ortsspalte der Ausgangstabelle (F) ist unspezifisch. Es wird aus ihr nicht ersichtlich, wann es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.
Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.


Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.
Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.


Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]], Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.
Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]]. Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.


Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:
Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:
Line 81: Line 79:
  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]
  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]


=== Inhalte ===
=== Inhalte / Schlagworte ===


Die Informationen der Spalte K, "Inhalt", sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten.
Die Informationen der Spalte K, "Inhalt", sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]".)


Die übergangenen 62 Felder finden sich für diese Nacharbeit hier gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]"
In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.  


Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es, die Themen möglichst spezifisch zu kennen: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte, zusammengesetzte Aussagen wie: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung im FactGrid von Interesse. Wir können uns die dezidierte Themenzuweisung leisten, da wir die Objekte wiederum in einer Klassifizierten Hierarchie der Kategorien führen, die sich ihrerseits in Suchen genereller Art hineinnehmen lässt.
Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.


Das FactGrid sieht keine Textfelder vor, sondern zwei Properties:
Konstruktiv wäre eine Bespielung der FactGrid Properties:


* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P256]] Things mentioned.
* [[Property:P256]] erwähnte Gegenstände
* [[Property:P33]] erwähnte Personen
* [[Property:P532]] erwähnte Ereignisse


=== Literatur ===
=== Literatur ===
Die Literaturangaben ließen sich isolieren, sind jedoch im Moment nicht tiefer ausgelotet, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. und überführte die Angaben nur in die Label. Bei Sammelwerken machte ich Objekte für die Aufsätze und die Objekte für die jeweiligen Bände auf, in denen sie sich finden und verlinkte entsprechend.
Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.


Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage spezifiziert.
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.


== Potentiale ==
== Potentiale ==


Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   
Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   


Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 23:32, 9 December 2022 (CET)
Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 22:44, 11 December 2022 (CET)

Latest revision as of 13:09, 12 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
  • Im Blatt "nicht importierte Schlagworte" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.

Anlage der primären Datenbankobjekte

Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:

  • Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in Item:Q457158 ein provisorisches aus in anderen Zellen.
  • P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
  • P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
  • P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
  • P135 + Item:Q467586, verbindet alle Objekte mit der Projektkennung Item:Q467586, die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:
https://tinyurl.com/2lxfgew4

Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von Item:Q456648:

Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518. Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte / Schlagworte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "Untergliedernde Items anlegen".)

In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.

Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.

Konstruktiv wäre eine Bespielung der FactGrid Properties:

Literatur

Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.

Potentiale

Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 22:44, 11 December 2022 (CET)