Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
Line 1: Line 1:
== FactGrid Import, Arbeitsbericht ==
== FactGrid Import, Arbeitsbericht ==
Ausgangspunkt des Dateninputs, der Ende November, Angang Dezember 2022 von mir durchgeführt wurde war die folgende Ausgangsdatei, hier erweitert mit einer Spalte A, die Links zu den angelegten Datenbankobjekten liefert:
https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0
Die einzelnen Spalten wurden weitgehend übernommen. Die Blätter "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" und "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" bieten die ausgelassenen Importe.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
* Im Blatt "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]" finden sich eingabefertig Zeilen mit Links, von denen die meisten obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe hat, respektive aus Kaliope aktuelle Information verlinken.


=== Anlage der primären Datenbankobjekte ===
=== Anlage der primären Datenbankobjekte ===
Vorlage war eine Excel-Liste mit 1677 Objekten: https://projekte.uni-erfurt.de/repertorium-bildungsgeschichte/lib/makexls.php.


Die ersten Arbeitsschritte waren:
Die ersten Arbeitsschritte waren:
   
   
* Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie [[Item:Q457158]] ohne Titel, hier generierte ich einen provisorisches Label aus in anderen Zellen gegebenen Informationen)
* Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie [[Item:Q457158]] ohne Titel, hier generierte ich einen provisorisches "Label" aus in anderen Zellen gegebenen Informationen)
* P2, eine Aussage zur Natur des Gegenstands,
* P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
* P11 einem vollständigen Titel (unsere "Label" sind auf 250 Zeichen beschränkt, die P11-Property lässt 1500 Zeichen zu),
* P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
* P843 einer Aussage zur WEMI-Kategorisierung im FRBR ("Functional Requirements for Bibliographic Records")-Gefüge. Wir gehen hier samt und sonders mit "Items" um, unikal nachgewiesenen Objekten ob einzelnen Büchern einer Ausgabe oder Akten-Codices.
* P329+P10 die Angabe des aktuellen Standorts mit Signatur
* P329+P10 die Angabe des aktuellen Standorts mit Signatur
* P135 + [[Item:Q467586]], die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
* P135 + [[Item:Q467586]], die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:


  https://tinyurl.com/2j3m2vl4
  https://tinyurl.com/2lxfgew4
 
Die Ausgangstabelle kann nun in FactGrid Datenbankabfragen generiert werden, wobei es sich nicht empfiehlt eine Gesamt-Tabelle zu erstellen. Klüger ist es nach Bedarf Abfragen zusammenzustellen und die Ergebnisse dann im spezifischen Interesse herunterzuladen.
 
Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) misslich.


=== Personen ===
=== Personen ===


Abgründig war die Eingabe der "Personen"-Spalte. Typisch waren hier Tabellenzellen mit Werten wie [[Item:Q456648]]:
Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von [[Item:Q456648]]:




  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]
  Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]


Graph-Datenbanken zeigen ihre Vorteile, wo immer sie Beziehungen zwischen Objekten sichtbar machen können. Es lag darum nahe, hier nicht einfach Textfelder wie vorgegeben zu befüllen, sondern die genannten Beteiligten zu isolieren und in ihren ihren Rollen wie angegeben zu notieren. Das ging, was die Trennung der Nennungen anbetraf, einigermaßen sauber, führte jedoch nicht sehr viel weiter.
Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen (Beteiligte) mit dann qualifizierenden Unteraussagen:


Alle Personen wurden im FactGrid einem matching unterzogen - wir erfassen derzeit um die 25.000 Personen mit einschlägigem Gotha-Bezug und Schwerpunkten bei den Pfarrerfamilien des Herzogtums<ref>Siehe Olaf Simons,
* '''Adressat''': ITEM &mdash; Q21 &mdash; Q#
Der erste Band des Thüringer Pfarrerbuchs (1500–1920) als Wikibase-Datensatz, FactGrid Blog, 2020-05-19, https://blog.factgrid.de/archives/1923</ref> und dem Gothaer Gymnasium,<ref>Siehe Olaf Simons,  “Wer waren die Absolventen des Gothaer Gymnasiums Illustre?” Blog bildungsgeschichte.de: https://bildungsgeschichte.de/beitrag/2773</ref>. Das Matching erweiterte den Kreis identifizierter Personen und stattete diese insbesondere mit genealogischen Hintergründen aus.
* '''Architekt''': ITEM &mdash; Q820 &mdash; Q36456
* '''Autograph''': ITEM &mdash; Q25 &mdash; Q#
* '''Autor''': ITEM &mdash; Q21 &mdash; Q#
* ‘'''Handschrift von''': ITEM &mdash; Q25 &mdash; Q#
* '''Kompilator''': ITEM &mdash; Q736 &mdash; Q# &mdash; Q820 &mdash; Q394351
* '''Künstler''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q820 &mdash; Q140761
* '''mutmaßlicher Schreiber''': ITEM &mdash; Q25 &mdash; Q# &mdash; Q155 &mdash; Q22868
* '''Nachlasser''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466890
* '''nicht identifizierte Person''': ITEM &mdash; Q17 &mdash; Q18711
* '''Ohne Nachweis in GND''': ITEM &mdash; Q599 &mdash; Q80692
* '''Person nicht identifiziert''': ITEM &mdash; Q17 &mdash; Q18711
* '''Sammler''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q21871
* '''Schenker''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466892
* '''Schreiber''': ITEM &mdash; Q25 &mdash; Q#
* '''Übersetzer''': ITEM &mdash; Q24 &mdash; Q#
* '''Unterzeichner''': ITEM &mdash; Q410 &mdash; Q#
* '''Urheber''': ITEM &mdash; Q21 &mdash; Q#
* '''Verfasser''': ITEM &mdash; Q21 &mdash; Q#
* '''Vorbesitzer''': ITEM &mdash; Q229 &mdash; Q# &mdash; Q820 &mdash; Q466893
* '''Werkstatt''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q700 &mdash; Q466894
* '''Zeichner''': ITEM &mdash; Q845 &mdash; Q# &mdash; Q820 &mdash; Q148400
* '''Zusammensteller''': ITEM &mdash; Q703 &mdash; Q# &mdash; Q820 &mdash; Q394797


Die neu angelegten Datenbankobjekte weisen dagegen im Moment keine vergleichbare Tiefe auf: Hier verfügen wir im Moment nur über die in der Datenressource gegebenen GND Eckdatierungen (Lebenszeit respektive Aktivitätszeitraum) und zuweilen über Berufs- oder Ortsangaben. Interessant wäre es, zu diesen Personen Datensätze zumindest im Ausmaß der GND-Tiefe zu haben. Ich versuchte einen grundlegenden Abgleich zwischen der GND und Wikidata, bezog jedoch aus beiden Ressourcen keine Tiefeninformationen zu den neu angelegten Personen.
Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.


Für die Graph-Datenbank blieben die "Personen"-Informationen damit insgesamt zu grob, um interessante weitere Fragen zu erlauben. Felder, wie das oben wiedergegebene notieren zwar Autoren und Empfänger, sie machen dabei jedoch keine weiteren Aussagen auch nur dazu, welcher Autor welchem Empfänger schrieb. Das Ergebnis sind darum Datenbankobjekte, in denen mehrere Autoren mehren Empfängern scheiben. Hier stieß eine sub-granulare Vorarbeit auf eine zu präzise Datenstruktur. Möglich wäre es gewesen, alternativ alle Personen unter der P703 Property diverser Personenbezüge zu notieren und Rollen dabei zu vermerken. Ich tat dies nicht, da Nutzer, die nach Martin Luther als Autor suchen, ihn in diesem Fall nicht mehr unter der Standardfrage finden, auf die hin wir andernorts granulieren.
Diese Datenanlage bleibt unbefriedigend, da wir hier trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, wie die Beteiligten zueinander stehen. Aus der Erschließung ging nicht hervor welcher Autor wem schrieb oder von wem Post erhielt, doch kann man nun zumindest erfassen, wo sich Materialen an eine Person oder von ihr finden. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.


Im [[Item:Q456648]] werden die Defizite deutlich - hier in der Anzeige aus Bruno Belhoste's FactGrid Viewer
=== Personen-Matching ===


https://database.factgrid.de/viewer/item/Q456648
Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.
 
Bei den Personen, die neu angelegt werden mussten blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungszeiten.


=== Ortsbezüge ===
=== Ortsbezüge ===


Die in der Vorgabe gelieferten Ortsbezüge waren durchweg unspezifisch. Sie ließen offen, ob der Ort einfach nur genannt wird oder ein Absendeort oder Druckort war - erst diese Spezifizierungen erlauben es jedoch, etwa Kommunikationsflüsse zwischen Orten sichtbar zu machen. Genutzt wurde hier die [[Property:P434]] für beliebige Ortsbezüge.
Die Ortsspalte der Ausgangstabelle (F) ist leider unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.


Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]], Lumbach (zu [[Item:Q457186]]) und Trittstedt zu [[Item:Q457208]] sind vermutlich ebenfalls fehlgelesen.
Nutzen ließ sich darum nur die [[Property:P434]] für beliebige Ortsbezüge.


Eine Landkartenrepräsentation ist zwar damit möglich aber ohne klare Aussage:
Labarz [[Item:Q457185]] identifizierte ich als Cabarz [[Item:Q43518]], Lumbach, erwähnt bei [[Item:Q457186]], und Trittstedt bei [[Item:Q457208]] ließen sich nicht zuordnen.
 
Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:


  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]
  [https://tinyurl.com/2hn9jobv Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind]


=== Thementiefe ===
=== Inhalte ===
 
Die Informationen der Spalte K "Inhalt" sind auf die [[Property:P724]] gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden. Hier wäre es angeraten, die notierten Dokumente als einzelne Objekte anzulegen und entsprechend zu verlinken. Ich nahm davon Abstand, da es hier mittlerweile eine Kaliope Erfassung gibt, die klugerweise einzuarbeiten wäre.
 
Die übergangenen 62 Felder finden sich hier für die Nacharbeit gelistet: "[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=714441547 Untergliedernde Items anlegen]"


Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es spezifisch die Themen zu haben: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte kombiniert wie mit der Aussage: "Gymnasiale Sammlung - Handschrift, Brief".


[[Item:Q457253]] das Objekt der Reise, um die es geht, und die ihrerseits mit Aussagen belegt sein muss: Wer nahm an der Reise teil? was waren Reisestationen?
Das FactGrid sieht hier zwei Properties mit spezifischen Referenzen vor (die ihrerseits dann in einem Ontologischen Gefüge  unter Oberbegriffen stehen):


[[Item:Q457734]] hier werden die Lebensläufe von Schulpfortaschülern gesammelt, doch ist die Schule Schulpforta nicht als Gegenstand notiert. Wer über sie forscht bekommt in der Folge keinen Link auf Akten zu ihr.
* [[Property:P243]] Topic/ Zentrales Thema
* [[Property:P256]] Things mentioned.  


=== Properties und Qualifier im Einzelnen ===
Hier war die Vorgabe nicht spezifisch genug in der thematischen Erschließung.


=== Literatur ===
=== Literatur ===
Die Literaturangaben ließen sich isolieren ließen sich isolieren (18 einzelne Objekte [[Item:Q467682]] bis [[Item:Q467699]] - sind jedoch im Moment durchweg selbst nicht tiefer vernetzt.
Die Literaturangaben ließen sich isolieren ließen, sind jedoch im Moment ihrerseits nicht tiefer vernetzt, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. notierte im wesentlichen nur die Angaben in den Labeln. Bei Sammelwerken machte ich regelmäßig Einzelne Objekte für die Aufsätze und die jeweiligen Bände auf, in denen sie sich finden.
 
Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("[https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=1164954111 nicht importierte URL-Angaben]"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage gewiesen.
 
== Entwicklungsrichtungen ==


Bei den Online Literaturangaben muss nachgearbeitet werden. Sie sind zwar eingabefertig, doch überprüfte ich die Links. Die meisten von ihnen bringen (mittlerweile) Fehlercodes oder sie sind oberflächliche Verweise auf Kaliope, ohne wirkliche Seiten-Links. Hier sollten wir noch mal gesprächsweise beraten, insbesondre die obsoleten Hans-Datenbanklinks werden sich vermutlich leicht aktualisieren lassen.
Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.


== Anmerkungen ==
Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 23:32, 9 December 2022 (CET)
<references/>

Revision as of 00:32, 10 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt des Dateninputs, der Ende November, Angang Dezember 2022 von mir durchgeführt wurde war die folgende Ausgangsdatei, hier erweitert mit einer Spalte A, die Links zu den angelegten Datenbankobjekten liefert:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die einzelnen Spalten wurden weitgehend übernommen. Die Blätter "Untergliedernde Items anlegen" und "nicht importierte URL-Angaben" bieten die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" finden sich 62 Zeilen mit Inhalten, die die Anlage einzelner untergliedernder Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten obsolet sind. Man musste hier manuell überprüfen, welchen Wert die Eingabe hat, respektive aus Kaliope aktuelle Information verlinken.

Anlage der primären Datenbankobjekte

Die ersten Arbeitsschritte waren:

  • Zu jedem Objekt einen Titel anlegen (es gab Gegenstände wie Item:Q457158 ohne Titel, hier generierte ich einen provisorisches "Label" aus in anderen Zellen gegebenen Informationen)
  • P2, eine Aussage zur Natur des Gegenstands (hier übernahm ich die Informationen aus Spalte E),
  • P11 einem vollständigen Titel - hier gibt es im Moment leere Zellen nach Vorgabe,
  • P329+P10 die Angabe des aktuellen Standorts mit Signatur
  • P135 + Item:Q467586, die Projektnennung, die es nun erlaubt, die Liste jederzeit in einer erweiterbaren Kurzform abzurufen. Das Kurzlink dieser Standardabfrage lautet mit im Moment partiell fehlenden Titelstatements und nach Standort und Signatur geordnet:
https://tinyurl.com/2lxfgew4

Die Ausgangstabelle kann nun in FactGrid Datenbankabfragen generiert werden, wobei es sich nicht empfiehlt eine Gesamt-Tabelle zu erstellen. Klüger ist es nach Bedarf Abfragen zusammenzustellen und die Ergebnisse dann im spezifischen Interesse herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) misslich.

Personen

Die Personenspalte basierte laut Vorgabe auf einem wenig spezifischen Datenmodell. In einer einzelnen Zelle sind Objekt für Objekt Personen mit jeweiligen Rollen notiert - hier etwa die Personen-Zelle von Item:Q456648:


Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen (Beteiligte) mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche nun entsprechend modifizieren, um Personen in den einzelnen Rollen genannt zu erhalten.

Diese Datenanlage bleibt unbefriedigend, da wir hier trotz der Aufschlüsselung der Rollen ohne Chance bleiben, Beziehungsgeflechte recherchierbar zu machen. Dazu hätte in jedem Einzelfall erfasst werden müssen, wie die Beteiligten zueinander stehen. Aus der Erschließung ging nicht hervor welcher Autor wem schrieb oder von wem Post erhielt, doch kann man nun zumindest erfassen, wo sich Materialen an eine Person oder von ihr finden. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid insbesondere Dank der der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über gut 25.000 Personen mit Gotha-Bezug, unter denen die 4200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten blieb ich dagegen bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungszeiten.

Ortsbezüge

Die Ortsspalte der Ausgangstabelle (F) ist leider unspezifisch. Es wird aus ihr nicht ersichtlich, wo es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518, Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte

Die Informationen der Spalte K "Inhalt" sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden. Hier wäre es angeraten, die notierten Dokumente als einzelne Objekte anzulegen und entsprechend zu verlinken. Ich nahm davon Abstand, da es hier mittlerweile eine Kaliope Erfassung gibt, die klugerweise einzuarbeiten wäre.

Die übergangenen 62 Felder finden sich hier für die Nacharbeit gelistet: "Untergliedernde Items anlegen"

Unter dem Strich ist die aktuelle Inhaltsaufschlüsselung suboptimal. Interessant wäre es spezifisch die Themen zu haben: Wo ist das Gymnasium Illustre etwa der Gegenstand der Darstellung? Die Spalte L bietet diese Klarheit nicht. Dort finden sich allgemeine Schlagworte kombiniert wie mit der Aussage: "Gymnasiale Sammlung - Handschrift, Brief".

Das FactGrid sieht hier zwei Properties mit spezifischen Referenzen vor (die ihrerseits dann in einem Ontologischen Gefüge unter Oberbegriffen stehen):

Hier war die Vorgabe nicht spezifisch genug in der thematischen Erschließung.

Literatur

Die Literaturangaben ließen sich isolieren ließen, sind jedoch im Moment ihrerseits nicht tiefer vernetzt, sprich: ich verlinkte nicht zu Autoren, Verlagen etc. notierte im wesentlichen nur die Angaben in den Labeln. Bei Sammelwerken machte ich regelmäßig Einzelne Objekte für die Aufsätze und die jeweiligen Bände auf, in denen sie sich finden.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen an den Kalliope-Verbundkatalog. Kalliope-Links waren ihrerseits nur auf die Homepage gewiesen.

Entwicklungsrichtungen

Theoretisch könnten wir im FactGid den Kontext erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 23:32, 9 December 2022 (CET)