FactGrid talk:GND-Daten-Import: Difference between revisions

From FactGrid
Jump to navigation Jump to search
(Created page with "== 13.2.2019, Gotha, Brainstorming == * Pagenhaus, Beteiligte: Mathias Manecke, Wolfgang Runschke, User:Olaf Simons|Olaf...")
 
Line 4: Line 4:
Im freien Gespräch dachten wir in drei verschiedene Richtungen:
Im freien Gespräch dachten wir in drei verschiedene Richtungen:


Erstens: Ein Datenmodell zu wählen, das sehr nahe an der bestehenden GND-Ontologie entlangläuft. Die Vorteile liegt in der bereits etablierten Standardisierung, der guten Dokumentierung, der breiten Verbindlichkeit, die dafür sorgt, dass alle Datenbanknutzer dieselbe Sprache sprechen und damit Suchergebnisse erschöpfend erzielen. Der Nachteil ist, das dies nicht die interessanteste Nutzung der sehr flexiblem Software auf einer freieren Forschungsplattform sein wird.
# '''Ein Datenmodell zu wählen, das sehr nahe an der bestehenden GND-Ontologie entlangläuft'''. Die Vorteile liegt in der bereits etablierten Standardisierung, der guten Dokumentierung, der breiten Verbindlichkeit, die dafür sorgt, dass alle Datenbanknutzer dieselbe Sprache sprechen und damit Suchergebnisse erschöpfend erzielen. Der Nachteil ist, das dies nicht die interessanteste Nutzung der sehr flexiblem Software auf einer freieren Forschungsplattform sein wird.


Zweitens: Den Schritt in Wikibase hinein zu nutzen, um gänzlich neue Modelle zu riskieren – extrem interessant hierbei, eine Modellierung die tragend auf Ereignisse als zentrale Entitäten zwischen Orten, Personen, und Dokumenten in der raum-zeitlichen Dimension setzt.
# '''Den Schritt in Wikibase hinein zu nutzen, um gänzlich neue Modelle zu riskieren – extrem interessant hierbei, eine Modellierung die tragend auf Ereignisse als zentrale Entitäten zwischen Orten, Personen, und Dokumenten in der raum-zeitlichen Dimension setzt.''' Das Interesse des von Mathias Manecke betriebenen GND4C-Projekts.


Drittens: Eine auf Schnelligkeit der Eingabe abzielende pragmatische Modellmischung. Das wichtigste Anliegen des GND Imports ins FactGrid ist es Benutzern das Eröffnen von Entitäten, wo immer möglich zu ersparen. Sie werten Dokumente aus und müssen nicht erst in anderen Datenbanken nach Personen, Orten und Körperschaften suchen, aus diesen Statements übernehmen, sondern sie verknüpfen und augmentieren gleich die nach GND-Standard bereits vorhandenen Datenbankobjekte und konzentrieren sich auf die eigentliche Forschungsarbeit.
''Drittens: Eine auf Schnelligkeit der Eingabe abzielende primär pragmatische Modellmischung, die irgendwo zwischen Wikidata und der GND-Ontologie steht.''' Das zentrale Anliegen des GND Imports ins FactGrid ist es, Benutzern das Eröffnen von Entitäten, wo immer möglich, zu ersparen. Sie werten Dokumente aus und müssen nicht erst in der GND nach Personen, Orten und Körperschaften recherchieren und Statements von dort übernehmen. Stattdessen verknüpfen und augmentieren sie gleich die bereits nach GND-Standard vorhandenen Datenbankobjekte und konzentrieren sich auf die Forschungsarbeit.


Wenn man nun zu Geburt, Tod, genealogischen Beziehungen fortwährend neue Ereignis-Entitäten anlegen muss, statt Information einfach in Form von Statements notieren zu können, geht der Bearbeitungsvorteil der bereits angefüllten nur noch auf neue Statements und Korrekturen wartenden Ressource wieder verloren.
::Wenn man nun zu Geburt, Tod, genealogischen Beziehungen fortwährend neue Ereignis-Entitäten anlegen muss, statt Information einfach als Statements notieren zu können, ginge der Bearbeitungsvorteil der bereits angefüllten Ressource wieder verloren, so die Sorge hier.


Andererseits wird gerade die wissenschaftlich forschende Datenbank absehbar neue Entitätstypen einführen – wie den Entitätstyp „Verbindung zu einer Gesellschaft“, der wesentlich feiner granuliert Informationen einer Mitgliedschaft im eigenen Item erfassen kann, das nun zur Organisation wie zur Person gehört.
::Andererseits wird gerade die wissenschaftlich forschende Datenbank absehbar neue Entitätstypen einführen – wie den Entitätstyp „Verbindung zu einer Gesellschaft“, der wesentlich feiner granuliert Daten zu Mitgliedschaften aufnehmen kann als eine Personenbiographie das aktuell kann. Auf die neue Entität mit den Detailinformationen zu einer Mitgliedschaft wird dann von der Person und der Organisation aus verwiesen.


Das unsaubere auf Schnelligkeit des Arbeitens zielende Datenmodell bleibt in einer Forschungsplattform ohne großes Risiko, da eine Datenbank später noch Umstrukturierungen ganzer Bereiche erlaubt. (Hier sind einer offizielle GND-Ressource andere Grenzen gesetzt – sie muss vor allem Stabilität der Modelle gewährleisten.)
Das auf Schnelligkeit des Arbeitens zielende Datenmodell bleibt in der Forschungsplattform ohne großes Risiko, da die Datenbank (anders als ein Wiki) spätere Umstrukturierungen im massenweisen Umbetten bestehender Einträge erlaubt. (Eine offizielle GND-Ressource wird weniger Frei sein, und gerade Stabilität der Modelle versprechen müssen.)


=== Verschiedene Modelle der Beziehung zwischen FactGrid und der GND ===
Vielleicht ist aber gerade dies der Reiz des Projektes: dass wir für unterschiedliche Anwendungen unterschiedliche Plattform mit unterschiedlichen Praktikabilitäten entwickeln, die aber miteinander kommunizieren können.


Die Forschungsplattform mit kann von der GND in den Grunddaten standardisiert eingegebene Datenbankobjekte gewinnen, die sie nun weiterverarbeiten kann, ohne noch eigens in der GND recherchieren zu müssen. Für die GND kann das Interesse an der Kooperation vor allem darin liegen, dass Benutzer hier Daten ohne Rückfrage korrigieren, Datensätze erweitern und Information mit Quellen belegen können.
=== Mögliche Beziehung des FactGrid zur GND ===


Denkbar ist einerseits eine enge Integration, bei der Benutzer bestimmte Daten gar nicht im FactGrid, somdern effektiv in der GND verändern, von wo sie eingespielt werden.
Die spezifische Forschungsplattform würde mit dem GND-Import standardisiert strukturierte Datenbankobjekte gewinnen, mit denen Forscher weiter arbeiten, ohne noch eigens in der GND recherchieren zu müssen. Für die GND kann dabei vor allem interessant werden, dass Benutzer hier Daten ohne Rückfrage korrigieren, Datensätze erweitern, neue Datensätze anlegen, Quellen liefern - ohne die GND berühren zu müssen.


Denkbar ist andererseits eine flexiblere Anbindung, bei der das FactGrid mit dem Input unabhängig arbeitet und die GND wie Wikidata nach jeweiligen Relevanzkriterien das System regelmäßig auf Änderungen hin befragen. Wird ein Geburtsdatum geändert, muss erfasst werden, ob es hierzu im FactGrid eine übernehmenswerte Forschungsangabe gibt.
Denkbar ist einerseits eine enge Integration, '''bei der Benutzer GND-Stammdaten tatsächlich gar nicht im FactGrid, sondern in der GND verändern (von wo sie eingespielt werden).


=== Enge Anbindung oder Plattformen unterschiedlicher Organisation? ===
Denkbar ist andererseits eine flexiblere Anbindung, bei der das FactGrid eher eine Quelle ist aus der sich die GND und Wikidata nach unterschiedlichen Relevanzkriterien bedienen. Regelmäßie Datenabgleiche filtern heraus, ob etwa Informationen wie Geburtsdaten geändert wurden und übernehmen vom FactGrid ganze Forschungsstatements wie von einer fremden Quelle.


Die entscheidende Frage ist vielleicht gar nicht, ob wir auf allen Plattformen nach denselben Modellen (und unter denselben Desideraten ökonomischen Arbeitens) agieren. Wichtiger ist vermutlich die Frage, ob wir die verschiedenen Instanzen so transparent organisieren können, dass sie bei unterschiedlichen Interessen an die Datenmodellierung immer noch miteinander kommunizieren können.
Die entscheidende Frage ist vielleicht gar nicht, ob wir auf allen Plattformen nach denselben Modellen laufen lassen. Wichtiger wäre vielleicht die Frage, ob wir die verschiedenen Instanzen so transparent organisieren können, dass sie sie trotzdem miteinander kommunizieren können, und Wissen in Aktualisierungenm voneinander beziehen können.


=== Praktische Schritte ===
=== Praktische Schritte ===


Wir kamen darin überein, dass es spannend wäre, wenn Mathias Manecke Ideen, die er für die GND4C andenkt, einmal im FactGrid mit Musterlösungen ausprobieren würde.
Wir kamen darin überein, dass es spannend wäre, wenn Mathias Manecke seine GND4C Ideen, einmal im FactGrid mit Musterlösungen ausprobieren würde. Es ist dabei aktuell kein Problem, wenn speziell für ein solches Experiment neue Properties geschaffen werden oder bestehende Properties ganz anders organisiert in einem Dutzend Biographien genutzt werden.


Es ist dabei kein Problem, wenn speziell zu einer solchen Modellierung neue Properties geschaffen wird und zwei oder 50 FactGrid-Biographien unter einem ganz anderen Datenmodell laufen als der Rest.
Wesentliche Fragen des Experiments wären:


Wesentliche Fragen des Experiments werden sein:
* Wie schwierig wird es, eine innovativere Ontologie Laien zu vermitteln? (Forscher sind was Ontologien anbetrifft Laien, die am ehesten kennen, was sie schon mal in Fragebögen gesehen haben)
 
* Wie mühsam wäre die innovativere Ontologie im Tagesgeschäft, wenn Dokumente ausgewertet werden, und Forscher neue Aussagen zu Personen, Orten, Ereignissen und Beziehungsgefügen machen wollen.
* Wie schwierig ist es, eine innovative Ontologie Laien zu vermitteln?
* Wie gestalten sich SPARQL-Recherchen (nachdem klar ist, dass man diese viel Wissen über doe Ontologie verlangen)?
* Wie mühsam wird eine innovativere Ontologie im Tagesgeschäft, wenn etwa Dokumente ausgewertet werden, und Forscher ohne viel Umstände Aussagen zu Personen, Orten, Ereignissen und Beziehungsgefügen machen wollen.
* Wie gestalten sich SPARQL-Recherchen im jeweiligen Modell (nachdem klar ist, dass man bei der SPARQL Suche immer erst die Ontologie, die zu den Daten führt).


=== Terminplan ===
=== Terminplan ===
…besteht erstmal nicht. Interessant wäre es bis Ende März Ideen am Beispielen demonstrieren zu können.
...besteht erstmal nicht. Interessant wäre es bis Ende März Ideen am Beispielen demonstrieren zu können.


=== weiteres Nachdenken ===
=== weiteres Nachdenken ===

Revision as of 12:00, 14 February 2019

13.2.2019, Gotha, Brainstorming

GND, GND neudenken, respektive pragmatisches Angebot an Forscher

Im freien Gespräch dachten wir in drei verschiedene Richtungen:

  1. Ein Datenmodell zu wählen, das sehr nahe an der bestehenden GND-Ontologie entlangläuft. Die Vorteile liegt in der bereits etablierten Standardisierung, der guten Dokumentierung, der breiten Verbindlichkeit, die dafür sorgt, dass alle Datenbanknutzer dieselbe Sprache sprechen und damit Suchergebnisse erschöpfend erzielen. Der Nachteil ist, das dies nicht die interessanteste Nutzung der sehr flexiblem Software auf einer freieren Forschungsplattform sein wird.
  1. Den Schritt in Wikibase hinein zu nutzen, um gänzlich neue Modelle zu riskieren – extrem interessant hierbei, eine Modellierung die tragend auf Ereignisse als zentrale Entitäten zwischen Orten, Personen, und Dokumenten in der raum-zeitlichen Dimension setzt. Das Interesse des von Mathias Manecke betriebenen GND4C-Projekts.

Drittens: Eine auf Schnelligkeit der Eingabe abzielende primär pragmatische Modellmischung, die irgendwo zwischen Wikidata und der GND-Ontologie steht.' Das zentrale Anliegen des GND Imports ins FactGrid ist es, Benutzern das Eröffnen von Entitäten, wo immer möglich, zu ersparen. Sie werten Dokumente aus und müssen nicht erst in der GND nach Personen, Orten und Körperschaften recherchieren und Statements von dort übernehmen. Stattdessen verknüpfen und augmentieren sie gleich die bereits nach GND-Standard vorhandenen Datenbankobjekte und konzentrieren sich auf die Forschungsarbeit.

Wenn man nun zu Geburt, Tod, genealogischen Beziehungen fortwährend neue Ereignis-Entitäten anlegen muss, statt Information einfach als Statements notieren zu können, ginge der Bearbeitungsvorteil der bereits angefüllten Ressource wieder verloren, so die Sorge hier.
Andererseits wird gerade die wissenschaftlich forschende Datenbank absehbar neue Entitätstypen einführen – wie den Entitätstyp „Verbindung zu einer Gesellschaft“, der wesentlich feiner granuliert Daten zu Mitgliedschaften aufnehmen kann als eine Personenbiographie das aktuell kann. Auf die neue Entität mit den Detailinformationen zu einer Mitgliedschaft wird dann von der Person und der Organisation aus verwiesen.

Das auf Schnelligkeit des Arbeitens zielende Datenmodell bleibt in der Forschungsplattform ohne großes Risiko, da die Datenbank (anders als ein Wiki) spätere Umstrukturierungen im massenweisen Umbetten bestehender Einträge erlaubt. (Eine offizielle GND-Ressource wird weniger Frei sein, und gerade Stabilität der Modelle versprechen müssen.)

Vielleicht ist aber gerade dies der Reiz des Projektes: dass wir für unterschiedliche Anwendungen unterschiedliche Plattform mit unterschiedlichen Praktikabilitäten entwickeln, die aber miteinander kommunizieren können.

Mögliche Beziehung des FactGrid zur GND

Die spezifische Forschungsplattform würde mit dem GND-Import standardisiert strukturierte Datenbankobjekte gewinnen, mit denen Forscher weiter arbeiten, ohne noch eigens in der GND recherchieren zu müssen. Für die GND kann dabei vor allem interessant werden, dass Benutzer hier Daten ohne Rückfrage korrigieren, Datensätze erweitern, neue Datensätze anlegen, Quellen liefern - ohne die GND berühren zu müssen.

Denkbar ist einerseits eine enge Integration, bei der Benutzer GND-Stammdaten tatsächlich gar nicht im FactGrid, sondern in der GND verändern (von wo sie eingespielt werden).

Denkbar ist andererseits eine flexiblere Anbindung, bei der das FactGrid eher eine Quelle ist aus der sich die GND und Wikidata nach unterschiedlichen Relevanzkriterien bedienen. Regelmäßie Datenabgleiche filtern heraus, ob etwa Informationen wie Geburtsdaten geändert wurden und übernehmen vom FactGrid ganze Forschungsstatements wie von einer fremden Quelle.

Die entscheidende Frage ist vielleicht gar nicht, ob wir auf allen Plattformen nach denselben Modellen laufen lassen. Wichtiger wäre vielleicht die Frage, ob wir die verschiedenen Instanzen so transparent organisieren können, dass sie sie trotzdem miteinander kommunizieren können, und Wissen in Aktualisierungenm voneinander beziehen können.

Praktische Schritte

Wir kamen darin überein, dass es spannend wäre, wenn Mathias Manecke seine GND4C Ideen, einmal im FactGrid mit Musterlösungen ausprobieren würde. Es ist dabei aktuell kein Problem, wenn speziell für ein solches Experiment neue Properties geschaffen werden oder bestehende Properties ganz anders organisiert in einem Dutzend Biographien genutzt werden.

Wesentliche Fragen des Experiments wären:

  • Wie schwierig wird es, eine innovativere Ontologie Laien zu vermitteln? (Forscher sind was Ontologien anbetrifft Laien, die am ehesten kennen, was sie schon mal in Fragebögen gesehen haben)
  • Wie mühsam wäre die innovativere Ontologie im Tagesgeschäft, wenn Dokumente ausgewertet werden, und Forscher neue Aussagen zu Personen, Orten, Ereignissen und Beziehungsgefügen machen wollen.
  • Wie gestalten sich SPARQL-Recherchen (nachdem klar ist, dass man diese viel Wissen über doe Ontologie verlangen)?

Terminplan

...besteht erstmal nicht. Interessant wäre es bis Ende März Ideen am Beispielen demonstrieren zu können.

weiteres Nachdenken