FactGrid talk:Göttingen-Gotha 1750-1850

From FactGrid
Revision as of 16:02, 2 January 2019 by Olaf Simons (talk | contribs) (→‎Nahe an regulären sprachlichen Aussagen)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Was das FactGrid kann

Normales Wiki und Wikibase-Installation

Das FactGrid ist erst einmal ein reguläres Wiki. Man kann damit beliebige Seiten eröffnen und auf diesen Seiten wie in Wikipedia schreiben und dabei beliebige Links zwischen den Seiten oder nach draußen setzen.

Spannender als solche "normalen Seiten" (wie diese hier) sind jedoch die Daten-Items, die man mit dem FactGrid anlegen kann. Die Software dazu ist Wikibase, dieselbe Software, mit der Wikidata läuft.

Um ein Datenobjekt (Item) anzulegen, geht man über diese Schablone

Die Möglichkeiten, die sich jetzt ergeben, sind komplexer: Datenobjekte finden sich klassisch in Tabellen und Online-Katalogen. Eine Tabelle kann eine erste Serie von Datenobjekten in einer Spalte "Städte" und eine zweite damit verbundene in einer Spalte der aktuellen "Bürgermeister" listen; ein Online-Katalog kann Datenbank-Items, etwa die Titel zu einem Autor (auch er ein Datenbank-Item) auf eine Suchanfrage hin auflisten. Die Wikibase Software kann eben das und im selben Moment noch weit mehr.

Anders als in einer klassischen Datenbank sind in Wikibase keine Vorgaben gemacht - es gibt keine Tabelle, die zu befüllen ist, kein vorab definiertes Objektsystem. Man macht zu einem Datenbankobjekt, das man anlegte, es ist erst einmal nichts als eine Q-Nummer auf und knüpft an dieses einzelne Aussagen. Dazu gibt es, sobald die Q-Nummer besteht, auf deren Seite das Link "Aussage hinzufügen", "add statement".

Also Objekt anlegen, ihm einen Namen geben, am besten auch eine kurze Beschreibung, eventuell auch Aliasse, wenn es etwa Namensvarianten gibt, die bei Suchen berücksichtigt werden sollen.

Durch jedes Statement, das man nun setzt, gewinnt das Objekt seine spezifischen Konturen und Eigenschaften, die es alleine hat oder mit anderen teilt.

Das Datenbank-Objekt kann ein Mensch sein. Man schaut zuerst nach, ob der bereits in der Datenbank existiert (über das Suchfeld oben rechts) und, wenn nicht, eröffnet man über Special:NewItem den Datensatz zu dieser Person, gibt ihr einen Namen, eine knappe biographische Notiz, gegebenenfalls Namensvarianten - abspeichern und das System hat ein Datenbankobjekt generiert, das jetzt mit eigener Q-Nummer existiert. Hier ein typischer Datensatz:

Dass die Person ein Mensch ist, kann die erste Aussage sein. "Ist ein"/"Instance of" (P2) lautet das gesuchte Verb, "Mensch"/"Human" (Q7) ist danach die erste Aussage.

Die zweite Aussage mag das Geschlecht erfassen: "Geschlecht"/"Gender" (P154) ist das hierzu benötigte Verb , weiblich (Q17), männlich (Q18) die Aussage. Am besten sieht man sich den Datensatz einer anderen Person an und arbeitet nach ihm, es gibt aber auch ein Nachschlagewerk der derzeit laufenden Aussagen.

"Geburtsdatum"/"Date of Birth" (P77) könnte die nächste Aussage sein - man erhält hier jetzt ein Eingabefeld für das Datum (unter allen möglichen Kalenderoptionen). "Geburtsort"/"Place of Birth" (P82) ist die nächste Aussage - das System erwartet hier (wie in der Regel) keine Texteingabe, sondern die passende Q-Nummer. Beginnt man Göttingen einzutippen, erhält man im Autocomplete bereits Vorschläge der bereits bestehenden Datenbankobjekte; Göttingen muss nicht mehr angelegt werden, der Ort besteht in Tausenden von Aussagen der Datenbank unter der Q-Nummer Q10284.

Wozu eine Datenbank?

Reguläre Wikiseiten lassen sich, das ist ihr struktureller Nachteil, nur über eine Textsuche auswerten. Wenn in einem normalen Wiki 800 Göttinger Studenten geführt sind, gibt es keinen Weg, das herauszufinden, es sei denn jemand "kategorisierte" alle Personenseiten und schuf dabei eine Unterkategorie "Student der Universität Göttingen". Im FactGrid liegt alle Information von Anfang an strukturiert vor. Man kann mit einer SPARQL-Suchanfrage sich so etwa alle Göttinger Studenten anzeigen lassen:

Das System kennt in dieser Sekunde (2. Januar 2019) 866 Göttingen Studenten des 18. und 19. Jahrhunderts. Man kann nun beliebige weitere Fragen stellen - etwa um eine Eingrenzung bitten: Welche dieser Studenten wurden in Gotha geboren?

...das sind im Moment nur vier.

Welche waren zeitweilige Bewohner Gothas?

...das sind immerhin 11. Man kann sich bei einer solchen Anfrage auch mehr anzeigen lassen - etwa zu jedem Göttinger Studenten mit zeitweiligem Gotha-Wohnsitz die Geburts- und Todesdaten:

SPARQL ist eine spezielle Abfrage-Sprache. Normalerweise fragt man Datenbanken über Schablonen ab - die Schablone sagt was man suchen kann, praktisch wenn man fünf oder zehn Kriterien der Suche im System hat. Hier dagegen schreibt man (unterstützt von einem Eingabehelfer) ein kleines Skript, mit dem man Datenmengen beliebig verquickt durchforsten kann - praktisch, wenn man hunderte von verschiedenartigen Aussagen im selben System verwaltet.

Über SPARQL-Abfragen lassen sich auch Visualisierungen herstellen - Netzwerke, Angaben auf Landkarten und so fort.

Wenn wir wie in einem konventionellen Wiki reguläre Artikel zu Personen, Gegenständen und Orten anlegen würden, müssten wir laufend überprüfen, was unsere Kollegen wo vermerkten und zudem Überblickslisten und Kategoriensysteme anlegen. Sobald wir dagegen Datenbank-Items mit strukturierten Aussagen anlegen, können wir gezielte Fragen an das System stellen und recherchieren, ob es in der Datenbank Gegenstände unseres jeweiligen Interesses gibt.

Nahe an regulären sprachlichen Aussagen

Anders als landläufige Bibliotheks-Datenbanksoftware geht Wikibase beliebig nahe an normalsprachliche Aussagen heran. Wir können selbst festlegen, welche Aussagen wir zu einer Person treffen wollen, beliebig viele, beliebig verschiedenartige.

Im Moment umfasst die Grammatik des FactGrid 254 mögliche Aussagen zu Personen, Dokumenten, Orten list of properties; das ist wenig, in Wikidata gibt es über 5000 Aussagen.

  • Das Verzeichnis der Aussagen nach verschiedenen Objekten des möglichen Interesses geordnet: Properties

Wenn wir ganz neuartige Aussagen treffen wollen, müssen wir die Property dazu definieren und schon können wir Q-Items mit dieser neuen Property belegen.

Das FactGrid spricht theoretisch alle Sprachen der Welt

Die Software verknüpft nur Q-Nummern mit anderen Q-Nummern oder alternativ mit Werten (wie etwa Daten oder Geokordinaten). Die Verknüpfungen geschehen stets über P-Nummern.

Der Vorteil der abstrakten Sprache aus Objekten und Properties - Q- und P-Nummern - ist, dass man sie mit beliebiger sprachlicher Information belegen kann. Wir können aussagen, wer Johann Friedrich Blumenbachs "Vater" war, aber genauso sagen, wer sein "father" war - die Property P141 ist im Moment mit beiden Sprachen belegt, ein Japaner könnte uns die 254 Aussagen in japanische Worten und Zeichen schenken, danach könnten Japaner die Datenbank in ihrer eigenen Sprache durchsuchen. (Wir könnten uns auch aus Wikidata die japanischen Informationen holen; Wikidata spricht jetzt bereits um die 200 Sprachen).

Das FactGrid ist für maschininelle Eingaben offen

Wie in den letzten Abschnitten beschrieben, lassen sich im FactGrid Datenbankobjekte einzeln generieren und nach Wunsch mit einzelnen Aussagen konturieren.

Die Datenbank ist jedoch gleichzeitig offen für den beliebigen Masseninput von Daten. Theoretisch kann man einen beliebigen Bibliothekskatalog oder eine jede Excel-Liste aus einem bisherigen Forschungsprojekt importieren. Das Werkzeug hierzu ist QuickStatements. Praktisch ist ein solcher Import, wenn man bereits Datenmengen aus anderen Projekten hat.

Es spielt für die Datenbank keine Rolle, ob es dergleichen Objekte bereits bestehen. Wir selbst legen, durch die Aussagen, die wir definieren fest, was man mit der Datenbank aussagen kann - und damit welcherart Objekte man hier generieren kann. Theoretisch können wir eine Insektensammlung von einer Excel-Liste aus einfügen, obwohl es bislang keine Aussagen zu Insekten oder Insekten selbst als Items in der Datenbank gibt: Die einzelnen Insekten, die 1780 in einem Katalog der Sammlung erfasst wurden, erhalten Q-Nummern. Wir wollen heutige Artenzuweisungen geben? Wir geben diesen dazu andere Q-Nummern und verknüpfen die Nummern in der Listeneingab. Wir können aber auch beliebige historische Artenzuweisungen erlauben. P255 könnte die Property für "Artenzuweisung nach System X des Forschers Y aus dem Jahre 1788" werden. Danach würden wir festlegen, welche Termini (Q-Nummern) dieser Forscher vergab und die Datenbankobjekte entsprechend belegen. Problemlos spricht das System verschiedene Sprachen nebeneinander. Wir könnten erfassen, woher die einzelnen Items kamen, und wir könnten, falls die Sammlung geographisch auseinander dividiert wurde, notieren, wohin welche Exemplare gingen.

Lägen die Daten bereits in einer langen Excelliste zu allen Exemplaren der Sammlung mit Spalten zu alten Benennungen, aktuellen Benennungen, damaligen und heutigen Standorten vor, würde man sie maschinell importieren. Lägen die Daten in einem anderen System vor, würde man sie in einen klassischen Listen-Output holen und importieren. Insekten kann das System genauso verwalten wie Ideen, zu denen wir eigene Q-Nummern und P-Aussagen vergeben könnten, etwa nach Notation der Stanford Ecyclopedia of Philosophy oder nach Zedlers Universal-Lexicon.

...am besten erst einmal nur als Zettelkasten nutzen

Das Beste wird es sein, das FactGrid erst einmal einfach als Zettelkasten nutzen. Personen, Objekte, Orte, Institutionen unseres Interesses lassen sich beliebig generieren. Jeder kann sich die vorliegende Projekt-Seite auf seine "Beobachtungsliste" setzen und eigene Fragen hier stellen oder Fragen der anderen hier beantworten. Erfahren Mitspieler, die hier mitlesen, werden jederzeit helfen, erste Datenbank-Objekte zu generieren. Die Objekte lassen sich mit beliebiger Information des Internets oder anderer Kataloge verknüpfen. Es gibt, anders als bei einem Wiki, keine Artikel-Leichen, da es kein Schaden ist, wenn zu einem Namen vielleicht nur zwei oder drei Aussagen bestehen.

Das Aparte am kollektiven Zettelkasten ist, dass man bei einem solchen vielleicht im Verlauf doch noch mehr Informationen erhält, weil plötzlich andere aus anderen Fragen heraus mit demselben Objekt umgehen und etwa einen Aktenfund mit ihm verbinden können.

Im Moment kennt das FactGrid über 800 Göttinger Studenten, nicht minder alle 1295 Gothaer Adressen des Zeitraums 1750 bis 1850 (samt ihren wechselnden Benennungen). Nicht alle sind bereits georeferenziert; wir bräuchten bei vielen der Adressen die historischen Geokoordinaten und eine historische Landkarte, um sie sinnvoll anzuzeigen:

Wir sind interessiert am weiterzitierbaren Forschungsausweis

Das FactGrid ist eine Forschungsdatenbank. Wir ermutigen Forscher, Datensätze namentlich zu kennzeichnen. Die Versionsgeschichte tut dies bereits automatisch, doch gehen wir hier einen Schritt weiter, indem wir zu expliziten Datenpublikationen aufrufen. Man kreiert eine Q-Nummer für die jeweilige Forschung und belegt Datensätze, die man generiert, danach gebündelt mit diesem Ausweis der eigenen Arbeit. Das System erlaubt es dann, alle Datenbankobjekte, zu denen das eigene Forschungsprojekt beitrug, geschlossen abzufragen. Wir können diesem gebündelten Komplex an Datensätzen eine DOI geben und sie namentlich in Publikationslisten verbuchen oder der DFG vermelden.

Nice !!

Und da gibt es noch eine dritte Gruppe, die ungleich schwerer zu greifen sein mag: Die Pensionsschüler in Gotha, die woanders geboren, von ihren Familien zum studienvorbereitenden Schulbesuch nach Gotha geschickt wurden... Einigen bin ich in der kurzen Zeit hier schon begegnet.--Martin Gollasch (talk) 16:09, 5 November 2018 (CET)

Und habe Dich soeben unter die Interessenten der Gruppe gesetzt. Mehr gleich per mail --Olaf Simons (talk) 16:15, 5 November 2018 (CET)

Bibliotheca Ilfeldensis

Die Klosterschule Ilfeld war eine der Kaderschmieden für die Göttinger Uni und die Einkünfte aus dem Besitz des ehem. Klosters wurden durch die Göttinger Uni direkt verwaltet (also schon eine frühe kleinere Stiftungslösung ...) Insofern ist schon der Göttingenbezug dieser Altbibliothek im Verhältnis beider Städte von Interesse, besonders Dokumente und Handschriften, soweit nicht von der Koko exportiert...--Martin Gollasch (talk) 22:52, 6 November 2018 (CET)

...und der Gotha-Bezug wäre, dass die Bibliothek nach Gotha kam? (was ich immer noch nicht überprüfte).. --Olaf Simons (talk) 08:23, 7 November 2018 (CET)
Hier Wikipedia zur Schule: https://de.wikipedia.org/wiki/Klosterschule_Ilfeld
Tja, den Zugang verdankt Gotha wohl dem Eisernen Vorhang und wieviele Göttinger Bezüge drin sein könnten, das ist die Frage... Das würde mich beim nächsten Besuch in Gotha schon sehr interessieren. Wenn Du den Aufsatz von Thomas Fuchs haben solltest, wäre ich für ein pdf dankbar.--Martin Gollasch (talk) 09:30, 7 November 2018 (CET)