User:Olaf Simons/Presentation: Difference between revisions

From FactGrid
Jump to navigation Jump to search
No edit summary
Line 1: Line 1:
FactGrid Vorstellung GND4C --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 12:54, 19 January 2023 (CET)
FactGrid Vorstellung GND4C --[[User:Olaf Simons|Olaf Simons]] 26. Okt. 2023
 
== Aktuelle Grund-Daten ==
 
* 640.000 Datenbankobjekte
* 356 Teilnehmer
* 30 laufende Projekte


== Integration ==
== Integration ==
# Gotha3
# Wikimedia https://blog.factgrid.de/archives/118
# DNB/GND https://blog.factgrid.de/archives/1475
#NFDI4Memory https://blog.factgrid.de/archives/3104


== Geschichte der Plattform ==
* Wikimedia https://blog.factgrid.de/archives/118
# Der Datensatz, an den sich anbauen ließ [[FactGrid:The Gotha Illuminati Research Base]]
* DNB/GND https://blog.factgrid.de/archives/1475
# Projekte, die im erst einmal leeren Raum entstehen: [[FactGrid:Projects]]
* NFDI4Memory https://blog.factgrid.de/archives/3104
# Projekte, die ganze Fachbereiche aufbauen - wie das [[FactGrid:Cuneiform Project]]
* Forschungszentrum Gotha
# Jährliche Verdoppelungsrate im Datenvolumen - und das scheint vorerst so zu bleiben; wir stehen derzeit bei 470.000 Datenbankobjekten.
* Historisches Datenzentrum Halle, Task Area 2 "Data Connectivity" des 4Memory Konsortiums
 
== Projekte während der Jenaer Zeit ==
* Umzug von Erfurt nach an die ThULB-Jena / aktuell nicht realisierbar, hier müssen wir mit dem NFDI-Geld größer angelegt nachdenken
* Integration in das Gotha Portal, bislang nur ein Link https://gotha.digital/
* Projekte der ThULB waren (so einfach) nicht realisierbar.
 
=== Landesantrag Wartburgfest ===


== Angebote: Das FactGrid als Dienstleister ==
:* Alle im FactGrid notierten Besucher des Wartburgfestes: https://tinyurl.com/27p3oj4o
* Klarnamen-Politik [[FactGrid:Nutzungsbedingungen]]
:* Die 119 FactGrid registrierten Teilnehmer des Wartburgfestes in ihrer Vernetzung in Freundschaftsbüchern: https://tinyurl.com/24aqocjb
* Anforderung des transparenten Projekt-Handlings (damit wehren wir Spammer ab)
:* Die 119 FactGrid notierten Teilnehmer des Wartburgfestes in ihrer Vernetzung durch Mitgliedschaften: https://tinyurl.com/26glmlh
* Arbeit ohne Relevanzkriterien
* Kollaboration an denselben Daten muss erwünscht sein
* Vernetzung im Inneren der Projekte untereinander
* Vernetzung nach außen: GND und Wikidata-Abgleich und Austausch


# Repositorium für alte Daten (schwierig, da Datenstandards meist schlecht sind: Textfelder, Zusatzbemerkungen, kein Matching gegen GND oder Wikidata).
=== Digitale Datenbank Existenzphilosophie ===
# Ziel-Repositorium für laufende Projekte, die ihre Daten der Forschungsarbeit einspielen wollen (oder bis dahin unsichtbar auf der Plattform sein, und dabei Objekte der Bearbeitung durch anderen  für Jahre entziehen möchten - beides geht nicht). Mein Rat ist hier stets: nicht erst am Ende Daten einspielen, eher das Projektdesign im Antragsstadium noch auf laufende Interaktion ausrichten.
nutzt Nodegoat
# Forschungsumgebung (Unmittelbare Nutzung von Information durch andere, kontrollierte Rezeption der eigenen Forschung noch während man mit ihr befasst ist - bewährt sich).
# Forschungswerkzeug und Zettelkasten (praktisch aber derzeit noch zu mühselig wegen fehlender großer Datenausgangslage; man muss zu oft neue Objekte anlegen).


== Was sich bewährt hat ==
=== Jüdische Schulen und Netzwerke ===
# Kooperation (Die Software lässt mehrere Antworten auf eine Frage zu und erlaubt konfligierende Belege)
Projekt Michael Wermke, derzeit im NFDI Incubator-Fund Antragsverfahren
# Fruchtbares Klima (unsere Sorge sind nicht Edit-Wars, sondern isolierte Projekte)
# Wissensakkumulation (bei uns hat Information Platz, die in Artikeln nicht unterzubringen ist, wir unterscheiden uns hier von Wikidata und der GND im Projekt)


== Problemstellen ==
=== Matrikel der Erfurter Studenten ===
=== Adressaten draußen ===
Lief erfolgreich, derzeit Erwägungen zu viel größerer Zusammenführung von Daten aus Matrikel-Datenbanken der Universitätsarchive. Ziel, hier über ein Start-Projekt der Hallenser Uni die größere Integration zu schaffen mit Wunschpartnern in Rostock, Jena und und Heidelberg
# SPARQL ist ein hermetischer Zugang. Den [https://database.factgrid.de/query/ Query Service] kann nur bedienen, wer die Datenlage und die Properties schon kennt.
# Musterabfragen bieten geringe Hilfe - nutzen wir aber derzeit auf Projektseiten wie [[FactGrid:The Gotha Illuminati Research Base]]
# Die Datenbankobjekte verwirren - vergleiche: [[Item:Q133]] und die hier viel instruktiveren Visualisierungen Bruno Belhostes (https://database.factgrid.de/viewer/item/Q133) und Michael Ringgaards (https://factgrid.ringgaard.com/kb/Q213880).
# Wir verfügen über zwei FactGrid Browser/Viewer, doch die bieten keine konklusiven Oberflächen.
::* Benötigt werden interne Suchoberflächen und Menüführungen.
::* Wichtig ist, dass Google auf den Viewer verweist, nicht auf die Items im FactGrid (die man erst zur Bearbeitung aufsuchen will).


=== Arbeit der Wissenschaftler ===
=== Projekte ohne Jena-Bezug ====
# SPARQL Hindernis - jedoch auch Klarheit, dass SPARQL interessant ist
In der ersten Jahreshälfte waren 12 Projekte aktiver zu betreuen, einige davon wurden mittlerweile abgeschlossen, neue sind hinzugekommen - die neuen:
# Visualisierungen unterentwickelt (dynamische Visualisierungen von Abläufen über die Zeit hinweg, quantitative Darstellungen (etwa wie viele Briefe gehen von einem Ort aus (so wie wir sie bei Corona Hotspot Landkarten hatten), Statistiken, Integration von Befunden auf historische Karten).
# Dateneingabe - hier ist der Vorabgleich schwierig, OpenRefine nicht breiter angenommen (muss z.B. erst installiert werden).
# Citizen Science braucht Module (auf denen die Bürgerwissenschaftler*innen unter sich und unter unmittelbarer Betreuung sind, sie wollen zumeist gar keinen eigenen Konten, und wollen auch nicht mit der ganzen Datenbank kommunizieren. Eingabeschablonen, die Daten sammeln, die dann durch die Projektleiter*innen eingefügt werden, sind hier notwendig).
# Datenlandschaft unterentwickelt, wir hätten gerne alle in der GND bekannten Personen mit Basis-Daten im FactGrid.
::* Dubletten-Risiko (Zehntausende Dubletten können unsere Mitspieler nicht bereinigen, wir dürfen keine Datenhalde erzeugen).
::* Datenfeinheit gegenüber Wikidata (ein Vorabgleich wäre hier wünschenswert).
::* Wir sollten einen laufenden Datenfluss in beide Richtungen anvisieren, bei dem Fehlerbereinigungen in beiden Instanzen (durch Bots) geschehen.
::* Koordinierte Arbeit mit der DNB/GND als Partner (statt eines Alleingangs unsererseits hätten wir lieber ein GND-Team an Bord).


=== Desiderate ===
* Vokabular der Gebrauchstextsorten
# Große Datenlage, die es Projekten erspart laufend neue Objekte anlegen zu müssen.
* Katrin Moeller: Berufsdatenbank
# Breite Bearbeitung durch Forschung, je mehr Forscher*innen an und mit der allgemeinen Datenlage arbeiten, desto besser.
* Klaus Falk: Die Regimenter des 30jährigen Kriegs
# Entwicklung eines attraktiven Frontends, das Dateneingabe durch Forscher*innen von Datennutzung durch Öffentlichkeit abkoppelt, do beides offen sichtbar gestaltet.
* Hamburger Sammlungen, Provenienzgeschichte Projekt
::* Das neue Frontend braucht eine Suchmaschine und Menüführung, die mit dem den eigenen Seiten kommuniziert.
* Klosterdatenbank des Germania Sacra Projektes
::* Das neue Frontend muss Daten aus der Vernetzung in der Datenbank auf den Item-Seiten verfügbar machen, die es generiert (etwa im Fall von Personen: deren Briefe listen, respektive im Fall von Organisationen und Geographica die Personenbeziehungen und die Ereignisse integrieren, die jeweils Personen und Ereignisseitig abgelegt sind).
* Sven Jaros: Politische Osteuropa-Publizistik des Ersten Weltkriegs
* Datenbank des Instituts für Zeitgeschichte
== Aktuell laufende Entwicklungen ==
* Nodegoat - wir müssen ähnliche Visualisierungen anbieten
* Knowledge-Graphen im NFDI Gefüge [https://database.factgrid.de/query/#SELECT%20%3FWikibase_instance%20%3FWikibase_instanceLabel%20%3FOrganisational_contextLabel%20%3FSoftwareLabel%20WHERE%20%7B%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%20%20%3FWikibase_instance%20wdt%3AP2%20wd%3AQ550371.%0A%20%20OPTIONAL%20%7B%20%3FWikibase_instance%20wdt%3AP267%20%3FOrganisational_context.%20%7D%0A%20%20OPTIONAL%20%7B%20%3FWikibase_instance%20wdt%3AP819%20%3FSoftware.%20%7D%0A%7D link] - wir sollten hier Wissen austauschen, miteinander arbeiten.


== Skalierbarkeit ==
== Desiderate ==
# Wir sind nicht wie Wikidata ein Pool der sich selbst einbringenden Individuen, sondern Plattform von Projekten (die einen anderen Betreuungsanspruch haben).
* Das fehlende Nutzerfreundliche Interface: Suchmaschine, Datenpräsentation und Visual Editor
# FactGrid hat sich selbst organisierende Communities, doch brauchen diese einen Helpdesk und Redaktionsräume.
# Wir sollten in der NFDI mit einer Agentur zusammenarbeiten, die Projekte berät.
# Die Gruppen und Einzelnen auf der Plattform müssen einen eigenen Trägerverein gründen.

Revision as of 23:24, 25 October 2023

FactGrid Vorstellung GND4C --Olaf Simons 26. Okt. 2023

Aktuelle Grund-Daten

  • 640.000 Datenbankobjekte
  • 356 Teilnehmer
  • 30 laufende Projekte

Integration

Projekte während der Jenaer Zeit

  • Umzug von Erfurt nach an die ThULB-Jena / aktuell nicht realisierbar, hier müssen wir mit dem NFDI-Geld größer angelegt nachdenken
  • Integration in das Gotha Portal, bislang nur ein Link https://gotha.digital/
  • Projekte der ThULB waren (so einfach) nicht realisierbar.

Landesantrag Wartburgfest

Digitale Datenbank Existenzphilosophie

nutzt Nodegoat

Jüdische Schulen und Netzwerke

Projekt Michael Wermke, derzeit im NFDI Incubator-Fund Antragsverfahren

Matrikel der Erfurter Studenten

Lief erfolgreich, derzeit Erwägungen zu viel größerer Zusammenführung von Daten aus Matrikel-Datenbanken der Universitätsarchive. Ziel, hier über ein Start-Projekt der Hallenser Uni die größere Integration zu schaffen mit Wunschpartnern in Rostock, Jena und und Heidelberg

Projekte ohne Jena-Bezug =

In der ersten Jahreshälfte waren 12 Projekte aktiver zu betreuen, einige davon wurden mittlerweile abgeschlossen, neue sind hinzugekommen - die neuen:

  • Vokabular der Gebrauchstextsorten
  • Katrin Moeller: Berufsdatenbank
  • Klaus Falk: Die Regimenter des 30jährigen Kriegs
  • Hamburger Sammlungen, Provenienzgeschichte Projekt
  • Klosterdatenbank des Germania Sacra Projektes
  • Sven Jaros: Politische Osteuropa-Publizistik des Ersten Weltkriegs
  • Datenbank des Instituts für Zeitgeschichte

Aktuell laufende Entwicklungen

  • Nodegoat - wir müssen ähnliche Visualisierungen anbieten
  • Knowledge-Graphen im NFDI Gefüge link - wir sollten hier Wissen austauschen, miteinander arbeiten.

Desiderate

  • Das fehlende Nutzerfreundliche Interface: Suchmaschine, Datenpräsentation und Visual Editor