Item talk:Q467586: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
Line 28: Line 28:
=== Personen ===
=== Personen ===


Die Personenspalte basierte birgt ein weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind Akte für Akte, Kodex für Kodex Personen mit Rollen notiert - hier die Personen-Zelle von [[Item:Q456648]]:
Die Personenspalte basiert auf einem weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex Personen mit Rollen notiert - hier die Personen-Zelle von [[Item:Q456648]]:




Line 59: Line 59:
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797
* '''Zusammensteller''': ITEM — Q703 — Q# — Q820 — Q394797


Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall erfasst werden müssen, welche Verfasser etwa welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.
Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. [[Item:Q456648]] macht dieses Strukturdefizit exemplarisch deutlich.


=== Personen-Matching ===  
=== Personen-Matching ===  

Revision as of 17:48, 11 December 2022

FactGrid Import, Arbeitsbericht

Ausgangspunkt der Dateneingabe, den ich Ende November/ Angang Dezember 2022 durchführte, war die folgende Ausgangsdatei, hier nun erweitert um eine neue Spalte A, die jetzt die Links zu den angelegten Datenbankobjekten liefert:

https://docs.google.com/spreadsheets/d/13IwogjuSOd-p2CTAwJ_anEymuXMX89pReC642T6IBRA/edit#gid=0

Die Informationen der einzelnen Spalten wurden weitgehend übernommen. Auf zwei zusätzlichen Blättern finden sich die ausgelassenen Importe.

  • Im Blatt "Untergliedernde Items anlegen" 62 Zeilen mit Inhalten, die die Anlage einzelner untergeordneter Datenbankobjekte verlangen.
  • Im Blatt "nicht importierte URL-Angaben" finden sich eingabefertig Zeilen mit Links, von denen die meisten mittlerweile obsolet sind und mit Kallioperecherchen zu aktualisieren wären.

Anlage der primären Datenbankobjekte

Zu allen Zeilen waren - 1677 - Datenbankobjekte anzulegen:

  • Jedes Objekt benötigte ein "Label". Wo es keine Titelinformation gab, generierte ich wie in Item:Q457158 ein provisorisches Label aus in anderen Zellen.
  • P2, übernimmt die Aussage zur Natur des Gegenstands aus Spalte E,
  • P11 bietet den vollständigen Titel - hier gibt es im Moment leere Zellen nach der Vorgabe,
  • P329+P10 bietet die Standortangaben mit alten und neuen Signaturen
  • P135 + Item:Q467586, verbindet alle Objekte mit der Projektkennung Item:Q467586, die es nun erlaubt, die Liste in einer erweiterbaren Kurzform abzurufen:
https://tinyurl.com/2lxfgew4

Theoretisch ließe sich eine Abfrage bilden, die das gesamte Datengefüge der Ausgangsdatei generiert. Es ist dies jedoch eine unattraktive Option. Die Ausgangsliste ist inhomogen in ihrer Zusammensetzung. Interessanter ist es, von nun an Abfragen nach Forschungsinteressen zu generieren und Ergebnisse selektiv herunterzuladen.

Beim Import waren insbesondere die Personen (D) und die Inhaltsspalte (K) problematisch.

Personen

Die Personenspalte basiert auf einem weitgehend unspezifisches Datenmodell. In einer einzelnen Zelle sind jeweils Akte für Akte, Kodex für Kodex Personen mit Rollen notiert - hier die Personen-Zelle von Item:Q456648:


Cyprian, Ernst Salomon (1673-1745) [Sammler] [GND-ID.: 119453363]; Amsdorff, Nicolaus von (1483-1565) [Verfasser] [GND-ID.: 118645056]; Borromeo, Carlo (1538-1584) [Verfasser] [GND-ID.: 118661957];Breckling, Friedrich (1629-1711) [Adressat] [GND-ID.: 11643998X];Bünau, Günther von (1564-1619) [Adressat] [GND-ID.: 104228520];Chemnitz, Martin (1522-1586) [Verfasser] [GND-ID.: 118829157];Chyträus, David (1531-1600) [Verfasser] [GND-ID.: 119009137];Cranach, Lucas d.Ä. (1472-1553) [Künstler] [GND-ID.: 118522582];Del Pozzo, Giacomo (1508-1563) [Verfasser] [GND-ID.: 124852432];Eber, Paul (1511-1569) [Verfasser] [GND-ID.: 118681524];Fischer, Christoph (1518-1598) [Adressat] [GND-ID.: 116535210];Glaser, Martin (-1553) [Adressat] [GND-ID.: 122329821];Glüenspieß, Philipp (-1565) [Adressat] [GND-ID.: 1117110907];Hassel, Johann Heinrich (1640-1706) [Verfasser, Adressat] [GND-ID.: 122950682];Hessus, Helius Eobanus (1488-1540) [Verfasser] [GND-ID.: 118704249];Horb, Johann Heinrich (1645-1695) [Verfasser] [GND-ID.: 119384124];Hosius, Stanislaus (1504-1579) [Adressat] [GND-ID.: 118775006];Johann, Sachsen, Kurfürst (1468-1532) [Verfasser] [GND-ID.: 100503225];Johann Friedrich II., Sachsen, Herzog (1529-1595) [Adressat] [GND-ID.: 100031900];Leib, Vinzenz (-1603) [Adressat] [GND-ID.: 1117591875];Luther, Martin (1483-1546) [Verfasser] [GND-ID.: 118575449];Melanchthon, Philipp (1497-1560) [Verfasser] [GND-ID.: 118580485];Moritz, Eichstätt, Bischof (1503-1552) [Verfasser] [GND-ID.: 119063905];Myconius, Friedrich (1490-1546) [Adressat] [GND-ID.: 118735454];Nürnberger Stadtrat [Adressat] [GND-ID.: 2003349-7];Seidel, Moritz [Adressat] [GND-ID.: 120614871];Selnecker, Nikolaus (1530-1592) [Verfasser] [GND-ID.: 118613073];Spalatin, Georg (1484-1545) [Verfasser] [GND-ID.: 118798170];Spangenberg, Cyriacus (1528-1604) [Verfasser] [GND-ID.: 119369958];Spener, Philipp Jakob (1635-1705) [Verfasser] [GND-ID.: 118616099];Stadtgeistlichen in Celle [Adressat] [nicht identifiziert];Sternberg, Hans von (-1535) [Verfasser, Adressat] [GND-ID.: 133984559];Timann, Johannes (1499-1557) [Adressat] [GND-ID.: 118802232];Weybringer, Johannes (-1572)[Verfasser, Adressat] [GND-ID.: 1105506886];Wilhelm IV., Hessen-Kassel, Landgraf (1532-1592) [Adressat] [GND-ID.: 118632922]

Ich ordnete die Rollen im folgenden Datenmodell an - einige in unmittelbaren Tripeln andere in allgemeinen Aussagen zu generell Beteiligten mit dann qualifizierenden Unteraussagen:

  • Adressat: ITEM — Q21 — Q#
  • Architekt: ITEM — Q820 — Q36456
  • Autograph: ITEM — Q25 — Q#
  • Autor: ITEM — Q21 — Q#
  • Handschrift von: ITEM — Q25 — Q#
  • Kompilator: ITEM — Q736 — Q# — Q820 — Q394351
  • Künstler: ITEM — Q845 — Q# — Q820 — Q140761
  • mutmaßlicher Schreiber: ITEM — Q25 — Q# — Q155 — Q22868
  • Nachlasser: ITEM — Q229 — Q# — Q820 — Q466890
  • nicht identifizierte Person: ITEM — Q17 — Q18711
  • Ohne Nachweis in GND: ITEM — Q599 — Q80692
  • Person nicht identifiziert: ITEM — Q17 — Q18711
  • Sammler: ITEM — Q229 — Q# — Q820 — Q21871
  • Schenker: ITEM — Q229 — Q# — Q820 — Q466892
  • Schreiber: ITEM — Q25 — Q#
  • Übersetzer: ITEM — Q24 — Q#
  • Unterzeichner: ITEM — Q410 — Q#
  • Urheber: ITEM — Q21 — Q#
  • Verfasser: ITEM — Q21 — Q#
  • Vorbesitzer: ITEM — Q229 — Q# — Q820 — Q466893
  • Werkstatt: ITEM — Q845 — Q# — Q700 — Q466894
  • Zeichner: ITEM — Q845 — Q# — Q820 — Q148400
  • Zusammensteller: ITEM — Q703 — Q# — Q820 — Q394797

Man kann die obige SPARQL Basissuche mit diesen Angaben gezielt erweitern, um Personen in den einzelnen Rollen herauszufiltern. Die damit herstellbare Datenanlage bleibt jedoch unbefriedigend, da sich bei der vorgenommenen Aufschlüsselung der Rollen keine Beziehungsgeflechte ergeben. Dazu hätte in jedem Einzelfall vor allem erfasst werden müssen, welche Verfasser welchen Adressaten schrieben. Item:Q456648 macht dieses Strukturdefizit exemplarisch deutlich.

Personen-Matching

Beim Datenimport kam die FactGrid-Datenlage dem importierten Datensatz entgegen. Im Dezember 2022 verfügte das FactGrid vor allem dank der Arbeit Heino Richards und des Kirchenarchivs im Augustinerkloster über Datenbankobjekte zu gut 25.000 Personen mit Gotha-Bezug, unter denen die 4.200 Absolventen des Gymnasiums Illustre bis in die 1880er Jahre komplett erfasst sind. Aus dem Thüringer-Pfarrerbuch kamen Lehrer und Dorfpfarrer extensiv hinzu. In diesen Fällen sind unsere Hintergrundinformationen jeweils extensiver als GND-Informationen.

Bei den Personen, die neu angelegt werden mussten, blieb ich bei den Basisdaten, die in der Vorgabe-Datei mitgeliefert waren: GND-Identifikator, Lebens-Eckdaten respektive Wirkungsdaten.

Ortsbezüge

Die Ortsspalte (F) der Ausgangstabelle ist durchweg unspezifisch. Es wird aus ihr nicht ersichtlich, wann es sich um Absende- oder Empfangsorte handelt, oder wo Orte das Thema der Darlegungen sind.

Nutzen ließ sich darum nur die Property:P434 für beliebige Ortsbezüge.

Labarz Item:Q457185 identifizierte ich als Cabarz Item:Q43518, Lumbach, erwähnt bei Item:Q457186, und Trittstedt bei Item:Q457208 ließen sich nicht zuordnen.

Eine Landkartenrepräsentation ist damit zwar möglich aber ohne klare Aussage:

Kartenansicht: Alle Orte, die mit den Datenbankobjekten in Verbindung gebracht sind

Inhalte

Die Informationen der Spalte K, "Inhalt", sind auf die Property:P724 gelegt, die für Texteingaben offen ist. Dabei übernahm ich 62 Felder nicht, in denen sich extensive Aufschlüsselungen von Dokumenten befanden, die wir als einzelne Dokumente anlegen und verlinken sollten. (Die übergangenen 62 Felder finden sich, wie gesagt) hier für eine eventuelle Nacharbeit gelistet: "Untergliedernde Items anlegen".)

Die Spalt L Schlagworte geht nicht klarer in die Inhalte. Hier finden sich allgemeine Schlagworte und zusammengesetzte Aussagen wie: "Gymnasiale Sammlung - Handschrift, Brief", die immer wieder in die die anderen Spalten (etwa eben zur Natur des Gegenstands) hinübergreifen. Hier wäre ein klärender Durchgang durch die Liste und eine Verlinkung auf Konkrete Themen von Interesse.

Die Graph-Datenbank erlaubt es Themen wie "Gymnasium Illustre" anzugeben. Sind bei diesen Objekten in Subkategorien (P3) Oberbegriffe notiert, dann lassen sich generelle Themensetzungen durch die Frage nach diesen Oberbegriffen recherchieren.

Konstruktiv wäre eine Bespielung der FactGrid Properties:

Literatur

Die einzelnen Titel der Literaturangaben ließen sich isolieren und einzeln den Objekten zuordnen, sind jedoch im Moment ihrerseits nicht weitergehend verlinkt. Autoren, Verlagen etc. sind genannt aber nicht vernetzt. Bei Sammelwerken machte ich Objekte für die Aufsätze die Bände auf, in denen sie sich befinden, und verlinkte diese entsprechend.

Bei den Online Links muss nachgearbeitet werden. Sie sind zwar eingabefertig ("nicht importierte URL-Angaben"), jedoch überwiegend nicht mehr aktuell. Links der Forschungsbibliothek gingen im Kalliope-Verbundkatalog auf. Kalliope-Links waren bislang nur auf die Homepage spezifiziert.

Potentiale

Theoretisch könnten wir im FactGrid den Datensatz erweitern: Wir kennen die Schüler und Lehrer des Gymnasiums mit detaillierten Familienbezügen und wir verfügen aus dem Kirchenarchiv über weitere Schulakten. Hier fehlt im Moment ein Konzept dazu, wie der Datensatz überhaupt angeboten sein soll - er ist nicht aus einem Guss, weist keine klare Corpus-Bildung auf.

Theoretisch könnten wir spezifische Suchen anbieten und die Datensätze unter einer Präsentationssoftware des Gotha-Portals sichtbar machen. Im Moment fehlt hierzu die passende Integration von FactGrid Daten. Das Gotha Portal verweist bislang nur auf das FactGrid als eine Ressource. --Olaf Simons (talk) 23:32, 9 December 2022 (CET)