Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
 
(22 intermediate revisions by the same user not shown)
Line 1: Line 1:
== Einige Bemerkungen ==
== FactGrid Import, Arbeitsbericht ==


=== Objektanlage ===
Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:


Vorlage war eine Excel-Liste mit 1676 Objekten. Die ersten Arbeitsschritte waren:
https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0
 
Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.
 
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1135315606 nicht importierte Schlagworte]" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.
 
=== Anlage der primären Datenbankobjekte ===
 
Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:
   
   
* Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie [[Item:Q457158]] ohne Titel, hier generierte ich einen provisorisches Label aus in anderen Zellen gegebenen Informationen)
* Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in [[Item:Q457158]] ein provisorisches aus in anderen Zellen.
* P2, eine Aussga zur Natur des Gegenstands,
* P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
* P11 einem vollständigen Titel (unsere "Label" sind auf 250 Zeichen beschränkt, die P11-Property lässt 1500 Zeichen zu),
* P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
* P843 einer Aussage zur WEMI-Kategorisierung im FRBR ("Functional Requirements for Bibliographic Records")-Gefüge. Wir gehen hier samt und sonders mit "Items" um, unikal nachgewiesenen Objekten ob einzelnen Büchern einer Ausgabe oder Akten-Codices.
* P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
* P329+P10 die Angabe des aktuellen Standorts mit Signatur
* P135 + [[Item:Q467586]], verbindet alle Objekte mit der Projektkennung [[Item:Q467586]], die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:
* P135 + [[Item:Q467586]], die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:


  https://tinyurl.com/2j3m2vl4
  https://tinyurl.com/2lxfgew4
 
Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.
 
Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.


=== Personen ===
=== Personen ===


Abgründig war die Eingabe der "Personen"-Spalte. Typisch waren hier Tabellenzellen mit Werten wie [[Item:Q456648]]:
Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von [[Item:Q456648]]:
 


  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]
  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]


Graph-Datenbanken dienen dazu, die Beziehungen zwischen Objekten sichtbar zu machen. Insofern lag es nahe, hier nicht einfach Textfelder mit eben dem angebotenen Input zu füllen, sondern die genannten Beteiligten zu isolieren und in ihren ihre Rollen wie angegeben zu definieren. Das ging, was die Trennung der Nennungen anbetraf einigermaßen sauber, führte jedoch nicht sehr viel weiter.
Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:


Alle Personen wurden im FactGrid einem matching unterzogen - wir erfassen derzeit um die 25.000 Personen mit einschlägigem Gotha-Bezug und Schwerpunkten in den Pfarrerfamilien des Herzogtums<ref>Siehe Olaf Simons,
* '''Adressat''': ITEM &mdash; Q21 &mdash; Q#
Der erste Band des Thüringer Pfarrerbuchs (1500–1920) als Wikibase-Datensatz, FactGrid Blog, 2020-05-19, https://blog.factgrid.de/archives/1923</ref> und dem Gothaer Gymnasium,<ref>Siehe Olaf Simons,  “Wer waren die Absolventen des Gothaer Gymnasiums Illustre?” Blog bildungsgeschichte.de: https://bildungsgeschichte.de/beitrag/2773</ref> es ließen sich hier neue Personen identifizieren und insbesondere genealogische Hintergründe eröffnen.
* '''Architekt''': ITEM &mdash; Q820 &mdash; Q36456
* '''Autograph''': ITEM &mdash; Q25 &mdash; Q#
* '''Autor''': ITEM &mdash; Q21 &mdash; Q#
* ‘'''Handschrift von''': ITEM &mdash; Q25 &mdash; Q#
* '''Kompilator''': ITEM &mdash; Q736 &mdash; Q# &mdash; Q820 &mdash; Q394351
* '''Künstler''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q820 &mdash; Q140761
* '''mutmaßlicher Schreiber''': ITEM &mdash; Q25 &mdash; Q# &mdash; Q155 &mdash; Q22868
* '''Nachlasser''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466890
* '''nicht identifizierte Person''': ITEM &mdash; Q17 &mdash; Q18711
* '''Ohne Nachweis in GND''': ITEM &mdash; Q599 &mdash; Q80692
* '''Person nicht identifiziert''': ITEM &mdash; Q17 &mdash; Q18711
* '''Sammler''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q21871
* '''Schenker''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466892
* '''Schreiber''': ITEM &mdash; Q25 &mdash; Q#
* '''Übersetzer''': ITEM &mdash; Q24 &mdash; Q#
* '''Unterzeichner''': ITEM &mdash; Q410 &mdash; Q#
* '''Urheber''': ITEM &mdash; Q21 &mdash; Q#
* '''Verfasser''': ITEM &mdash; Q21 &mdash; Q#
* '''Vorbesitzer''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466893
* '''Werkstatt''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q700 &mdash; Q466894
* '''Zeichner''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q820 &mdash; Q148400
* '''Zusammensteller''': ITEM &mdash; Q703 &mdash; Q# &mdash; Q820 &mdash; Q394797


Die neu angelegten Datenbankobjekte weisen dagegen im Moment keine vergleichbare Tiefe auf: Hier verfügen wir im Moment nur über die in der Datenressource gegebenen GND Eckdatierungen (Lebenszeit respektive Aktivitätszeitraum) und zuweilen über Berufs- oder Ortsangaben. Interessant wäre es, zu diesen Personen Datensätze zumindest im Ausmaß der GND-Tiefe zu haben. Mittlerweile ist die Wikidata-Aussagen-Tiefe, wo sie besteht vielfach interessanter. Ich versuchte einen grundlegenden Abgleich zwischen beiden Datenbanken, bezog jedoch aus beiden Ressourcen keine Tiefeninformationen aus ihnen zu den neu angelegten Personen.
Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.


Für die Graph-Datenbank blieben die "Personen"-Informationen insgesamt zu grob. Felder, wie das oben wiedergegebene notieren zwar Autoren und Empfänger, tatsächlich machen sie dabei jedoch keine Aussage dazu, welcher Autor welchem Empfänger schrieb. Das Ergebnis sind darum Datenbankobjekte, in denen mehrere Autoren mehren Empfängern scheiben. Hier stieß eine sub-granulare Vorarbeit auf eine zu präzise Datenstruktur. Möglich wäre es gewesen, alternativ alle Personen unter der P703 Property diverser Personenbezüge zu notieren und Rollen dabei zu vermerken. Ich tat dies nicht, da Nutzer, die nach Martin Luther als Autor suchen, ihn in diesem Fall nicht mehr unter der Standardfrage finden, auf die hin wir andernorts granulieren.
=== Personen-Matching ===


Im [[Item:Q456648]] werden die Defizite deutlich - hier in der Anzeige aus Bruno Belhoste's FactGrid Viewer
Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.


https://database.factgrid.de/viewer/item/Q456648
Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.


=== Ortsbezüge ===
=== Ortsbezüge ===


Die in der Vorgabe gelieferten Ortsbezüge waren durchweg unspezifisch. Sie ließen offen, ob der Ort einfach nur genannt wird oder ein Absendeort oder Druckort war - erst diese Spezifizierungen erlauben es jedoch, etwa Kommunikationsflüsse zwischen Orten sichtbar zu machen. Genutzt wurde hier die [[Property:P434]] für beliebige Ortsbezüge.
Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.
 
Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.
 
Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]]. Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.
 
Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:
 
[https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]
 
=== Inhalte / Schlagworte ===
 
Die Informationen der Spalte K, "Inhalt", sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]".)
 
In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.
 
Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.
 
Konstruktiv wäre eine Bespielung der FactGrid Properties:
 
* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P256]] erwähnte Gegenstände
* [[Property:P33]] erwähnte Personen
* [[Property:P532]] erwähnte Ereignisse


Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]], Lumbach (zu [[Item:Q457186]]) und Trittstedt zu [[Item:Q457208]] sind vermutlich ebenfalls fehlgelesen.
=== Literatur ===
Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.


=== Thementiefe ===
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.


== Potentiale ==


[[Item:Q457253]] das Objekt der Reise, um die es geht, und die ihrerseits mit Aussagen belegt sein muss: Wer nahm an der Reise teil? was waren Reisestationen?
Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf. 


=== Properties und Qualifier im Einzelnen ===
Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 22:44, 11 December 2022 (CET)

Latest revision as of 13:09, 12 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt der Dateneingabe, die ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei - hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten bietet:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf drei zusätzlichen Blättern finden sich die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.
  • Im Blatt "nicht importierte Schlagworte" sind dies im wesentlichen Schlagworte, die bereits in anderen Spalten auftauchten wie Gattungsbezeichnungen und Generalia wie Schüler im Falle von Schülerlisten.

Anlage der primären Datenbankobjekte

Zu den 1677 Zeilen waren ebenso viele Datenbankobjekte anzulegen:

  • Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in Item:Q457158 ein provisorisches aus in anderen Zellen.
  • P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
  • P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen wie in der Vorlage,
  • P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
  • P135 + Item:Q467586, verbindet alle Objekte mit der Projektkennung Item:Q467586, die es nun erlaubt, die Liste in einer Kurzform abzurufen, die sich gezielt erweitern lässt:
https://tinyurl.com/2lxfgew4

Theoretisch ließe sich eine Abfrage konzipieren, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter sind von nun an Abfragen nach Forschungsinteressen mit der Chance, deren spezifische Ergebnisse für die jeweils gewünschte Verarbeitung herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex, Personen mit Rollen notiert - hier die Personen-Zelle von Item:Q456648:

Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Daten, die die Vorgabe-Datei lieferte: zumeist GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518. Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte / Schlagworte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich für eine eventuelle Nacharbeit hier gelistet: "Untergliedernde Items anlegen".)

In der Spalte L "Schlagworte" finden sich sowohl allgemeine Schlagworte wie zusammengesetzte Aussagen von der Art: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (wie hier etwa zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf konkrete Themen von Interesse.

Die Graph-Datenbank erlaubt es, referenzierte Gegenstände wie das "Gymnasium Illustre" exakt anzugeben. Sobald diese Objekten ihrerseits über die dortige Aussagen P2 Oberbegriffe zugeordnet sind, lassen sich in einer P2/P3 Abfrage generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.

Konstruktiv wäre eine Bespielung der FactGrid Properties:

Literatur

Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment selbst nicht weitergehend verlinkt. Autoren, Verlagen etc. sind in den Labels genannt aber nicht mit Aussagen verlinkt (da hier die weiterführenden Informationen nicht gegeben wearen). Bei Sammelwerken machte ich Objekte für die Aufsätze und die Bände auf, in denen sie sich befinden, und verlinkte diese untereinander.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren jedoch bislang nur auf die Homepage gerichtet.

Potentiale

Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha-Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 22:44, 11 December 2022 (CET)