FactGrid:GND-Daten-Import: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
 
Line 5: Line 5:
* [[User:Sarah Hartmann|Sarah Hartmann]]
* [[User:Sarah Hartmann|Sarah Hartmann]]
* [[User:Hendrikje Carius|Hendrikje Carius]]
* [[User:Hendrikje Carius|Hendrikje Carius]]
== Die ganze GND oder weniger? ==
Die Ursprüngliche Idee war es bei 1900 einen Zeitschnitt zu machen und das Projekt auf Personen und Körperschaften zu beschränken.
Im Moment ist fraglich, ob wir damit den Interessen am Projekt noch gerecht werden.
* Der Zeitschnitt 1950 könnte interessanter sein, da er den Nationalsozialismus noch umschließt.
* Der Verzicht auf den Zeitschnitt könnte interessanter sein, da er die Ressource gleichberechtigt neben die laufende GND stellen würde
Fraglich ist bei der offenen Konzeption wie wir das Problem der Änderungswünsche lebender Personen handhaben ohne eine GND-Redaktion dazu zu haben.
In die Frage gehört nebenbei, wie wir mit Orten und Themen umgehen – der Import sollte eine möglichst gut binnenvernetzte Ressource schaffen.
== Things statt Strings ==
Beim Testinput von GND Datensätzen zu den Logen erwiesen sich Texteingabe-Felder als Problem. Daten waren in verschiedenen Konventionen eingegeben und nicht als Daten sondern als Text im System. Bei Orten etc. hätte man gerne ein Maximum an Verlinkung der Items. Die DNB Testinstanz, die ich durchsah war noch stark string-basiert.
== Doubletten ==
Ein Desiderat wäre der Abgleich mit Wikidata, schon allein zur Vermeidung von Doubletten – das ist ein Projekt, das auch im Interesse der DNB liegen sollte.
== Matching der Aussagen ==
Von FactGrid-Seiten aus scheint es (die Erfahrung des Test-Input von Logendaten) nicht so kompliziert, die GND-Daten auf unsere Syntax zuzuschneiden oder unsere Syntax auf den Input vorzubereiten.
Ein wesentliches Anforderungsprofil ist hier Wissen über das was an möglichen Triple-Aussagen von der GND kommt.
Im Fall der Logenblieb überschaubar was es da an Aussagen gab, zu denen das FactGrid-Vokabular reichen musste.
Ideal wäre es von der DNB überblick über die Aussagetypen zu erhalten, auf die wir vorbereitet sein müssen. Wir können dann im Gegenzug die Grammatik für die Eingabe herstellen.
Gibt es DNB-intern einen Überblick über die zu Personen und Institutionen tatsächlich gemachten Aussagen?
== Der Input selbst ==
Das Gothaer Projekt ist im Moment noch technisch prekär aufgestellt. Wir verfügen über keinen Ansprechpartner im Uni-Rechenzentrum. Zwei Lösungen kämen uns entgegen:
* Der Aufbau eines aus dem Wikidata zu rekrutierenden Teams, das den Input betreut
* Hilfe seitens der DNB, die für die die Bespielung des FactGrid zum Test würde
Wir mussten zu diesem Zweck wohl die laufende Datenbank duplizieren und eventuell zur Vermeidung zweier auseinanderlaufender Datenbanken ein Eingabeoratorium bei uns einlegen.
== Der (zukünftige) Informationsabgleich ==
Ein zentrales Anliegen der Kooperation ist es, Weichen zu stellen, um spätere Informationsangleichungen möglich zu machen.
Hier fehlt im Moment von allen Seiten das technische Konzept. Eine gemeinsame Befüllung der Datenbank sollte da den Blick auf die Problemzonen schärfen.
* Wie gehen wir beim Input mit bereits bestehenden FactGrid Datensätzen um?
* Können wir das Überspielen von FactGrid-Information verhindern?
* Lässt sich abgleichen, wo Daten zwischen dem FactGrid und der GND differieren?


== DNB Testinstanzen ==
== DNB Testinstanzen ==

Latest revision as of 16:38, 20 December 2019

DNB Testinstanzen

  • GND 2.0 Testinstanz Mathias Manecke
  • GND 3.0 Testinstanz Hans-Jürgen Becker