Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
 
(10 intermediate revisions by the same user not shown)
Line 1: Line 1:
== FactGrid Import, Arbeitsbericht ==
== FactGrid Import, Arbeitsbericht ==


Ausgangspunkt des Dateninputs, der Ende November, Angang Dezember 2022 von mir durchgeführt wurde war die folgende Ausgangsdatei, hier erweitert mit einer Spalte A, die Links zu den angelegten Datenbankobjekten liefert:
Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:


https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0
https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0


Die einzelnen Spalten wurden weitgehend übernommen. Die Blätter "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" und "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" bieten die ausgelassenen Importe.
Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.


* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe hat, respektive aus Kaliope aktuelle Information verlinken.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1135315606 nicht importierte Schlagworte]" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.


=== Anlage der primären Datenbankobjekte ===
=== Anlage der primären Datenbankobjekte ===


Die ersten Arbeitsschritte waren:
Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:
   
   
* Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie [[Item:Q457158]] ohne Titel, hier generierte ich einen provisorisches "Label" aus in anderen Zellen gegebenen Informationen)
* Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in [[Item:Q457158]] ein provisorisches aus in anderen Zellen.
* P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
* P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
* P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
* P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
* P329+P10 die Angabe des aktuellen Standorts mit Signatur
* P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
* P135 + [[Item:Q467586]], die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
* P135 + [[Item:Q467586]], verbindet alle Objekte mit der Projektkennung [[Item:Q467586]], die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:


  https://tinyurl.com/2lxfgew4
  https://tinyurl.com/2lxfgew4


Die Ausgangstabelle kann nun in FactGrid Datenbankabfragen generiert werden, wobei es sich nicht empfiehlt eine Gesamt-Tabelle zu erstellen. Klüger ist es nach Bedarf Abfragen zusammenzustellen und die Ergebnisse dann im spezifischen Interesse herunterzuladen.
Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.


Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) misslich.
Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.


=== Personen ===
=== Personen ===


Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von [[Item:Q456648]]:
Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von [[Item:Q456648]]:
 


  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]
  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]


Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen (Beteiligte) mit dann qualifizierenden Unteraussagen:
Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:


* '''Adressat''': ITEM — Q21 — Q#
* '''Adressat''': ITEM — Q21 — Q#
Line 59: Line 59:
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797


Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.
Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.
 
Diese Datenanlage bleibt unbefriedigend, da wir hier trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, wie die Beteiligten zueinander stehen. Aus der Erschließung ging nicht hervor welcher Autor wem schrieb oder von wem Post erhielt, doch kann man nun zumindest erfassen, wo sich Materialen an eine Person oder von ihr finden. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.


=== Personen-Matching ===  
=== Personen-Matching ===  


Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.
Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.


Bei den Personen, die neu angelegt werden mussten blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungszeiten.
Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.


=== Ortsbezüge ===
=== Ortsbezüge ===


Die Ortsspalte der Ausgangstabelle (F) ist leider unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.
Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.


Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.
Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.


Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]], Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.
Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]]. Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.


Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:
Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:
Line 81: Line 79:
  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]
  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]


=== Inhalte ===
=== Inhalte / Schlagworte ===


Die Informationen der Spalte K "Inhalt" sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden. Hier wäre es angeraten, die notierten Dokumente als einzelne Objekte anzulegen und entsprechend zu verlinken. Ich nahm davon Abstand, da es hier mittlerweile eine Kaliope Erfassung gibt, die klugerweise einzuarbeiten wäre.
Die Informationen der Spalte K, "Inhalt", sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]".)


Die übergangenen 62 Felder finden sich hier für die Nacharbeit gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]"
In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.  


Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es spezifisch die Themen zu haben: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte kombiniert wie mit der Aussage: "Gymnasiale Sammlung - Handschrift, Brief".
Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.


Das FactGrid sieht hier zwei Properties mit spezifischen Referenzen vor (die ihrerseits dann in einem Ontologischen Gefüge  unter Oberbegriffen stehen):
Konstruktiv wäre eine Bespielung der FactGrid Properties:


* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P256]] Things mentioned.
* [[Property:P256]] erwähnte Gegenstände
 
* [[Property:P33]] erwähnte Personen
Hier war die Vorgabe nicht spezifisch genug in der thematischen Erschließung.
* [[Property:P532]] erwähnte Ereignisse


=== Literatur ===
=== Literatur ===
Die Literaturangaben ließen sich isolieren ließen, sind jedoch im Moment ihrerseits nicht tiefer vernetzt, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. notierte im wesentlichen nur die Angaben in den Labeln. Bei Sammelwerken machte ich regelmäßig Einzelne Objekte für die Aufsätze und die jeweiligen Bände auf, in denen sie sich finden.
Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.


Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage gewiesen.
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.


== Entwicklungsrichtungen ==
== Potentiale ==


Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   
Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.   


Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 23:32, 9 December 2022 (CET)
Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 22:44, 11 December 2022 (CET)

Latest revision as of 13:09, 12 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
  • Im Blatt "nicht importierte Schlagworte" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.

Anlage der primären Datenbankobjekte

Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:

  • Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in Item:Q457158 ein provisorisches aus in anderen Zellen.
  • P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
  • P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
  • P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
  • P135 + Item:Q467586, verbindet alle Objekte mit der Projektkennung Item:Q467586, die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:
https://tinyurl.com/2lxfgew4

Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von Item:Q456648:

Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518. Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte / Schlagworte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "Untergliedernde Items anlegen".)

In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.

Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.

Konstruktiv wäre eine Bespielung der FactGrid Properties:

Literatur

Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.

Potentiale

Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 22:44, 11 December 2022 (CET)