Help:Daten aus einem Tabellenblatt in FactGrid eingeben

From FactGrid
Jump to navigation Jump to search

In der Betreuung von Projekten haben sich gemeinsame Google-Spreadshets als extrem hilfreiches Arbeitsinstrument erwiesen.

Zum einen kann man diese Spreadsheets von verschiedenen Seiten aus betreuen, zum anderen sind sie mit Excel-Grundkenntnissen auch von Geisteswissenschaftlern gut zu bedienen, vor allem aber erlauben sie im Verlauf direkte Übertritte in die Datenbank, in den beiden Eingabeformaten, die QuickStatements, das Werkzeug für Masseneingaben bereithält.

Auf dieser Seite eine knappe Anleitung dazu, wie man ein solches Datenblatt auf Eingaben vorbereitet. Das Beispiel ist eine Datei die zwischen User:Heino Richard und User:Olaf Simons eine Eingabe der Schülerliste vorbereitet, die Richard aus der 1929 veröffentlichten Schülerliste des Jahres 1929[1] Ende 2022 generierte.

https://docs.google.com/spreadsheets/d/1ASPscc70wyNW66-MVhr86ib9lR0zIJIuBcb16eQWclY/edit#gid=1040247030

Gemeinsames Datenblatt herstellen

  1. Die Ausgangsdatei in ein Google-Spreadsheet überführen, damit dieses von verschiedenen Seiten aus bearbeitet werden kann muss es freigegeben werden (im Musterfall bleibt diese Bearbeitbarkeit eingeschränkt)
  2. Schalten Sie der Tabelle zwei Spalten vor - eine gute Praxis ist es, die erste rot und die zweite blau zu färben. Die rote Spalte wird mit einer durchlaufenden Nummerierung versehen, die zweite ist erst einmal leer und wird im Verlauf die Q-Nummern erhalten, die die Datenbank den einzelnen Schülern zuweisen wird..
  3. Die Liste wird wieder und wieder neu sortiert werden; die rote Spalte erlaubt es dabei jederzeit, wieder auf die Original-Sortierung zurückzukommen - das ist praktisch, da viele Projekte eine spezifische Quelle abbilden, zu deren eigener Sortierung sich ohne diese Nummerierung nachher nicht wieder zurückkommen lässt.
  4. Machen Sie eine Kopie des Datenblatts (das Kontext-Menü des Tabs unten auf der Seite erlaubt das). Nutzen sie diese Kopie für die Vorbereitung der weiteren Eingaben. Auf der ersten Seite bleibt das Original des Projektes erhalten. Über die roten spalten lassen sich mit "Vlookup" jederzeit wieder Tabellenspalten korrigieren - zu Vlookup im Verlauf.

Im vorliegenden Beispiel ist dies die Seite, von der aus die nächsten Schritte erfolgen:

https://docs.google.com/spreadsheets/d/1ASPscc70wyNW66-MVhr86ib9lR0zIJIuBcb16eQWclY/edit#gid=158953953

Vorbereitende Checks

In Projekten schleichen sich immer wieder datentechnische Unsauberkeiten ein:

  1. Überprüfen Sie in einem langsamen Durchlauf von oben nach Unten, ob es in der vorgelegten Tabelle Zeilenbrüche gibt - mitunter legen Projekte kleine Aufzählungen in Zellen an, die bei der Dateneingabe später Verwirrung erzeugen. Jede Zeile sollte eine die Höhe nur einer Zeile aufweisen.
  2. Erfassen Sie ob in einzelnen Spalten mehre Spalten stecken, hier werden Trennungen nötig. Eine Tabelle kann etwa Wohnorte von Personen notieren und wenn eine Person sukzessive an mehreren Orten lebte in der entsprechenden Spalte mehrere Werte in Angaben wie "Köln, ab 1910 München" aufweisen. in solchen Fällen werden Trennungen nötig.
  3. Erfassen Sie Bemerkungen, die in Zellen gesetzt wurden - bei Jahreszahlen ist das Beliebt mit Fragezeichen, ca.-Angaben etc. In der späteren Eingabe darf in einer Spalte zu Kalenderdaten nichts als ein einziges Kalenderdatum stehen. Zusatznotizen müssen in einem eigenen Qualifier zum Datum gesetzt werden und benötigen dazu eigene Tabellenzellen.

Die Spalte verstehen

Die Tabelle, die Heino Richard vorlegte ([https://docs.google.com/spreadsheets/d/1ASPscc70wyNW66-MVhr86ib9lR0zIJIuBcb16eQWclY/edit#gid=1040247030 dieses Tabellenblatt), kam bereits mit einiger Vorerfahrung zustande.

  • Spalte A bietet den Nachnamen.
  • Die Spalten E-G bieten die Vornamen von 1 bis 3 isoliert an.
  • Spalte H das Geburtsjahr,
  • Spalte I den Geburtsort.
  • In den Spalten J und K ist erfasst von wann bis wann der Schüler die Schule besuchte
  • Spalte L notiert Studienunterbrechungen
  • Die Spalten M-P haben bereits alle multiplen Berufsangaben aufgeteilt.
  • Die Spalten Q-S tun dasselbe mit bis zu drei Wohnortangaben
  • Spalte T notiert das Sterbedatum
  • Spalte den Sterbeort
  • Spalte V erfasst zuweilen eine Angabe zur Todesursache, davon scheint die Schule vor allem bei Kriegsgefallenen Informationen erhalten zu haben.

Spalte W bietet diesbezügliche Details zumeist was den Ort anbetrifft.

Die Objekte mit Basis-Informationen anlegen

Um die Personen anzulegen ist es nötig, ihnen in einem ersten Schritt Ausgangsinformationen zuzuweisen, an die die Q-Nummern für jede einzelne gekoppelt werden.

Das kann sich einfacher oder schwieriger gestalten, je nachdem ob ein Vor-Abgleich mit der Datenbank nötig wird oder nicht. Der vorliegende Fall gestaltete sich übersichtlich. Wir konnten davon ausgehen, dass kaum ein Schüler bereits in der Datenbank notiert war.

Erika Maria Mustermann
  1. In einem eigenen Blatt, bringe ich die drei Namensspalten D-E-F-G in die Wunschreihenfolge E-F-G-D und füge sie zusammen (geht bei geringem Wissen auch in Notepad oder Word)
  2. Für die neu generierte Spalte mit den Anzeigenamen eröffne vier Spalten rechts von B, diese erhalten die Überschriften Lde, Len, Lfr, Les für Label auf Deutsch, Englisch, Französisch und Spanisch.
  3. Mit dem jeweiligen Projekt kläre ich, was für Eigenschaften die anzulegenden Objekte alle miteinander teilen - sie alle gehen in die erste Eingabe. Im vorliegenden Fall folgen diese Eigenschaften in den Spalten G bis K:
  1. Alle hier anzulegenden Objekte sind Menschen. Die diesbezügliche Aussage lautet qid (anzulegende Person) — P2 (ist ein) — Q7 (Mensch). P2 wird in der CSV Datei, auf die wir hin arbeiten, die Überschrift von Spalte G, Q7 der Wert für alle Personen die ganze Spalte hinab.
  2. Alle hier anzulegenden Personen sind, Spalte H, männlichen Geschlechts (P154 — Q18)
  3. Alle besuchten, Spalte I, das Gymnasium Heiligenstadt (P160 — Q458481)
  4. Alle sind, Spalte J, alphabetisch in derselben Quelle gelistet (P124 — Q459499)
  5. Alle sind, Spalte K, Teil von Heino Richards Projekt Thüringer Genealogie (P131 — Q459500)

Alle anderen Spalten weisen im vorliegenden Fall Lücken auf oder fordern mehr oder minder unangenehme Umformungsschritte ein und bleiben deshalb bei der Erstablage der Person vorerst auf Warteliste.

Matching: Überprüfen, ob die Personen bereits in FactGrid bestehen

Das Matching gab im vorliegenden Fall nur drei Treffer, die weiter unten im Alphabet folgten. Bei ihnen setzten wir die Q-Nummern in die blaue Spalte und glichen die Labels ab.

Die Objekte mit Basis Information anlegen

Das Anlegen von Personen ist über CSV Tabellen übersichtlich durchführbar, bei allen weiteren Eingaben bevorzuge ich in QuickStatements die Version 1-Eingabe bei der direkt vom Tabellenblatt eingegeben wird.

  1. Für die CSV-Eingabe muss aus den Spalten D-K eine CSV Tabelle erstellt werden. Dabei müssen die Text-Spalten D-F (in denen keine Q-Nummern stehen) Anführungsstriche erhalten. Im Google Spreadsheet geht das mit Strg+H und den Variablen ^ für Zellenbeginn und $ für Zellenende in Wechselbefehlen bei denen "Search using regular expressions" anzuklicken ist.
  2. Wenn die Namen in den Spalten D-F alle in Anführungsstrichen stehen, kann man die Spalten B-K markieren und in einem Notepad die Tabulatorstellen zwischen den Werten durch Kommata ersetzen. Man hat danach eine CSV-Datei, eine Datei mit Comma-Separated-Values. Zur Demonstration lege ich diese umgeformte Datei hier im Google Sheet ab
  3. Im FactGrid Menü QuickStatements öffnen, dort die CSV-Datei im Eingabefenster ablegen. (Bei der erstmaligen Bedienung wird eine Aufforderung sich einzuloggen erfolgen.)
  4. Auf CSV-Input klicken und überprüfen, ob die Eingabe wie gewünscht geschieht und dann mit Import CSV commands absenden.

Die bestehende Tabelle mit Q-Nummern ausstatten

QueryService, P131-Funktionalität und VLOOKUP hier erklären

Datumsangaben

Ortsangaben

Berufsangaben

  1. Karl Pabst (ed.), Verzeichnis der Schüler des Staatl. kathol. Gymnasiums zu Heiligenstadt (Heiligenstadt, 1929-05-22).