FactGrid talk:Erik-Amburger-Datenbank: Difference between revisions

From FactGrid
Jump to navigation Jump to search
Line 30: Line 30:
Wenn wir Daten korrekt importieren müssen wir bedenken, dass der QueryService sie ohne spezielle Anweisung automatisch auf den Gregorianischen Kalender umgestellt wieder herausgibt, sie dürfen danach nicht als julianische weiterbehandelt werden. Importe aus Wikidata sind kritisch, da speziell massenweise generierte Wikidata-Daten ohne Rücksicht auf die Kalenderfrage als mutmaßlich gregorianische Datierungen in Wikidata generiert wurden.
Wenn wir Daten korrekt importieren müssen wir bedenken, dass der QueryService sie ohne spezielle Anweisung automatisch auf den Gregorianischen Kalender umgestellt wieder herausgibt, sie dürfen danach nicht als julianische weiterbehandelt werden. Importe aus Wikidata sind kritisch, da speziell massenweise generierte Wikidata-Daten ohne Rücksicht auf die Kalenderfrage als mutmaßlich gregorianische Datierungen in Wikidata generiert wurden.


== Famileinverbindungen ==
== Familienverbindungen ==
...scheinen sich nicht ohne weiteres aus der Ambuger-Datenbank beziehen zu lassen - dort scheinen keine Vernetzungen der Identifier vorzuliegen, wie FactGrid sie automatisch verlangt. Vermutlich lassen sich Zuordnungen jedoch relativ leicht über gemeinsame Datierungen und Lokalisierungen vornehmen. Bei Eheschlüssen ist oft das Aufgebot exakt datiert. Die [[Property:P1079]] ist eingerichtet dies als Qualifier unter der jeweiligen Ehe zu erfassen.
...scheinen sich nicht ohne weiteres aus der Ambuger-Datenbank beziehen zu lassen - dort scheinen keine Vernetzungen der Identifier vorzuliegen, wie FactGrid sie automatisch verlangt. Vermutlich lassen sich Zuordnungen jedoch relativ leicht über gemeinsame Datierungen und Lokalisierungen vornehmen. Bei Eheschlüssen ist oft das Aufgebot exakt datiert. Die [[Property:P1079]] ist eingerichtet dies als Qualifier unter der jeweiligen Ehe zu erfassen.


Hat man die Ehepartner, kann man vielleicht über deren Verbindung die Kinder leichter Paaren als einzelnen Personen zuordnen.
Hat man die Ehepartner, kann man vielleicht über deren Verbindung die Kinder leichter Paaren als einzelnen Personen zuordnen.
::Hier hat uns am Anfang Magnus Sälgö (Q40921) bei FactGrid ziemlich geholfen, indem er einen Schub von geni:IDs neben den Verbindungen zu wd generiert hat. Vllt solltest Du ihn mal anpingen, ob er uns noch einmal helfen kann/mag. Schweden und Finnlandschweden waren ja die nächsten Nachbarn zu Batlitikum und der St. Petersburger Ecke Russlands.--[[User:Martin Gollasch|Martin Gollasch]] ([[User talk:Martin Gollasch|talk]]) 18:56, 14 March 2024 (CET)


== Ortsbestimmungen ==
== Ortsbestimmungen ==

Revision as of 18:56, 14 March 2024

Ausgangslage 14. März 2024

Mit Datum vom 14.3.2024 sind zu allen - 95.385 - Personen der Amburger-Datenbank Items angelegt (einige Dubletten fielen bei der Eingabe ins Auge). Soweit wie Wikidata diese Personen referenzierte, sind diese Referenzen übernommen und im Gegenzug FactGrid-IDs auf die Wikidata-Objekte aufgespielt. Mit den Personendatensätzen ist das Geschlecht der Personen erfasst. Über die P533 Property kommt man von jeder Person unmittelbar in den entsprechenden Datensatz der Amburger-Datenbank. Das folgende Link bietet auf dem schnellsten Weg das Matching:

Importe von Statements aus der Amburger Datenbank gestalten sich nicht so einfach wie Exporte aus dem FactGrid. Es wird klug sein, einfache Importe zuerst vorzunehmen, arbeitsaufwändige dagegen eher zum Gegenstand von Projekten zu machen, die organisiert und bei größerem Aufwand finanziert sein wollen.

Im Folgenden Arbeitsprojekte in einzelnen Rubriken:

Nachnamen

...sollten einfach sein, da sich hier ein exaktes Matching gegenüber den bestehenden herstellen lässt. Fehlende Nachnamen müssen angelegt werden, bevor sie zugewiesen werden können.

Herausforderung: die Russischen Versionen transkribierter Familiennamen (scheinen nicht in der Amburger-Datenbank notiert, sind aber vielleicht über die wissenschaftliche Transkription (?) rekonstruierbar.

Bei Neuanlagen von Nachnamen zur Standardisierung das Batch-Fragment benutzen.

Vornamen

...sind komplexer als Nachnamen, da wir ihre Reihenfolge wiedergeben sollten, und da hier größere Varianz besteht mit (aufzulösenden) Abkürzungen und Transkriptionen, hinter denen Schreibweisen im kyrillischen Schriftsystem verborgen liegen.

Bei Neuanlagen von Vornamen ist das Geschlecht zu erfassen. Hierzu zur Standardisierung das Batch Fragment benutzen.

Datierungen

...gibt es an verschiedensten Stellen: Geburt- und Sterbedaten, Daten des Aufgebots bei Eheschließungen etc. Herausforderung: Die beiden Kalender alter (julianischer) und neuer (julianischer) Stil. Beim Massenimport lassen sich die Varianten, wo immer sie als solche notier sind, mit der /J Erweiterung des Statements abbilden. Frage: sind die Kalender durchweg auseinander gehalten? Wie sieht es bei den baltischen Ländern aus? Wie bei Weißrussland? (Das Polnisch-Litauische Großfürstentum schritt relativ früh zum neuen Kalender.)

Wenn wir Daten korrekt importieren müssen wir bedenken, dass der QueryService sie ohne spezielle Anweisung automatisch auf den Gregorianischen Kalender umgestellt wieder herausgibt, sie dürfen danach nicht als julianische weiterbehandelt werden. Importe aus Wikidata sind kritisch, da speziell massenweise generierte Wikidata-Daten ohne Rücksicht auf die Kalenderfrage als mutmaßlich gregorianische Datierungen in Wikidata generiert wurden.

Familienverbindungen

...scheinen sich nicht ohne weiteres aus der Ambuger-Datenbank beziehen zu lassen - dort scheinen keine Vernetzungen der Identifier vorzuliegen, wie FactGrid sie automatisch verlangt. Vermutlich lassen sich Zuordnungen jedoch relativ leicht über gemeinsame Datierungen und Lokalisierungen vornehmen. Bei Eheschlüssen ist oft das Aufgebot exakt datiert. Die Property:P1079 ist eingerichtet dies als Qualifier unter der jeweiligen Ehe zu erfassen.

Hat man die Ehepartner, kann man vielleicht über deren Verbindung die Kinder leichter Paaren als einzelnen Personen zuordnen.

Hier hat uns am Anfang Magnus Sälgö (Q40921) bei FactGrid ziemlich geholfen, indem er einen Schub von geni:IDs neben den Verbindungen zu wd generiert hat. Vllt solltest Du ihn mal anpingen, ob er uns noch einmal helfen kann/mag. Schweden und Finnlandschweden waren ja die nächsten Nachbarn zu Batlitikum und der St. Petersburger Ecke Russlands.--Martin Gollasch (talk) 18:56, 14 March 2024 (CET)

Ortsbestimmungen

gibt es wie Datierungen im breiten Spektrum der Positionen. Mit OpenRefine sind bereits gegenüber Wikidata Orte erfasst. Wir sollten die Lokalitäten aber unabhängig vom Amburger-Projekt flächendeckend anlegen - das steigert die Konsistenz der gesamten Anlage.

Aktuell weitgehend erfasst sind

  • Polen
  • Litauen
  • der Oblast Kaliningrad
  • Ukraine (ca. 75%)
  • Tschechien

Desiderate sind aktuell:

  • Slowenien
  • Weißrussland
  • Lettland
  • Estland
  • Russland

Religion

Dies müsste eine besonders schnell herstellbare Aussage sein, nachdem das Spektrum der Aussagen klein ist.

Datensatz-Verdruß

...ist eine interessante FactGrid-Property (Property:P17):

Weiterführendes

  • Henning von Wistinghausen: Freimaurer und Aufklärung im Russischen Reich: Die Revaler Logen 1773–1820. Band III: Biographisches Lexikon (Q43277) - bislang gefühlt etwa 10-15 % Überschneidung, wobei der extreme Tiefgang bei den v. Wistinghausen-Bios sich qualitativ als sehr hilfreich bemerkbar macht.
  • Scotland, Scandinavia and Northern European Biographical Database (Q800757) - diese Datenbank der Uni St. Andrews hilft bei historischen Personen mit schottischen Wurzeln, die in Skandinavien und/oder Nordosteuropa bis nach Russland von 1580 bis 1707 aktiv waren. Das sind im Zweifel meist Offiziere.
  • Arvo Tering (Hrsg.): Lexikon der Studenten aus Estland, Livland und Kurland an europäischen Universitäten 1561–1800, Böhlau-Verlag, Köln 2018 (Q40931) für die Akademiker des Zeitraums; Tering hätte seinem Werk beim Bearbeitungszeitraum gern 15 Jahre mehr geben dürfen!--Martin Gollasch (talk) 14:24, 10 March 2024 (CET)