Help:Daten aus einem Tabellenblatt in FactGrid eingeben

From FactGrid
Jump to navigation Jump to search

Ablauf um aus einem Datenblatt (Excel, Google, Access Datenbank) eine FactGrid-Eingabe zu machen.

Die nachfolgenden Arbeitsschritte sind mit diesem Google Spreadsheet dokumentiert, wobei ich es zur bequemeren Handhabung bei Zeile 600 abbrechen lasse.

Gemeinsames Datenblatt herstellen

  1. Die Ausgangsdatei in ein Google Spreadsheet überführen und dieses zur Bearbeitung freigeben, so dass wir von verschiedenen Seiten aus am selben Datenblatt arbeiten können
  2. Im ersten Blatt, das angelegt werden soll, zwei Spalten A und B vorschalten.
  3. Die neue Spalte A erhält eine Nummerierung, die mit der Zeilen-Nummerierung übereinkommt und wird in dunklerem Purple gefärbt. Diese Spalte erlaubt es, in allen im folgenden von hier aus generierten Blättern jederzeit (über VLOOKUP respektive SVERWEIS) ein Matching vorzunehmen zu können, sie macht es zudem einfach, in Tabellen jederzeit die Ausgangssortierung wiederherzustellen.
  4. Die neue Spalte B erhält die Überschrift "qid" und wird blau gefärbt. Sie wird im Verlauf mit den Q-Nummern aus FactGrid gefüllt. Wikidata-Q-Nummern hinterlege ich in Spalten, in denen sie auftauchen können im Standard grün, das sichert bei im Verlauf vollkommen uniform aussehenden Spalten, dass die Ressourcen, die beide Q-Nummern verwenden, optisch getrennt bleiben.
  5. Das erste Datenblatt duplizieren. Das erste Blatt wird dabei zur "Ausgangstabelle", das Duplikat zum "Eingabeblatt"

Labels vorbereiten

Im vorliegenden Fall sollen 599 Schüler des Gymnasiums Heiligenstadt angelegt werden. Bei der Dateneingabe wurden bereits Nachnamen und Vornamen isoliert, für das Label müssen die Komponenten in einer neuen Spalte zusammengesetzt werden. Die FactGrid-Konvention ist dabei wie in Wikidata und Wikipedia

Erika Maria Mustermann
  1. In einem eigenen Blatt, bringe ich die drei Namensspalten D-E-F-G in die Wunschreihenfolge E-F-G-D und füge sie zusammen (geht bei geringem Wissen auch in Notepad oder Word)
  2. Für die neu generierte Spalte mit den Anzeigenamen eröffne vier Spalten rechts von B, diese erhalten die Überschriften Lde, Len, Lfr, Les für Label auf Deutsch, Englisch, Französisch und Spanisch.
  3. Mit dem jeweiligen Projekt kläre ich, was für Eigenschaften die anzulegenden Objekte alle miteinander teilen - sie alle gehen in die erste Eingabe. Im vorliegenden Fall folgen diese Eigenschaften in den Spalten G bis K:
  1. Alle hier anzulegenden Objekte sind Menschen. Die diesbezügliche Aussage lautet qid (anzulegende Person) — P2 (ist ein) — Q7 (Mensch). P2 wird in der CSV Datei, auf die wir hin arbeiten, die Überschrift von Spalte G, Q7 der Wert für alle Personen die ganze Spalte hinab.
  2. Alle hier anzulegenden Personen sind, Spalte H, männlichen Geschlechts (P154 — Q18)
  3. Alle besuchten, Spalte I, das Gymnasium Heiligenstadt (P160 — Q458481)
  4. Alle sind, Spalte J, alphabetisch in derselben Quelle gelistet (P124 — Q459499)
  5. Alle sind, Spalte K, Teil von Heino Richards Projekt Thüringer Genealogie (P131 — Q459500)

Alle anderen Spalten weisen im vorliegenden Fall Lücken auf oder fordern mehr oder minder unangenehme Umformungsschritte ein und bleiben deshalb bei der Erstablage der Person vorerst auf Warteliste.

Matching: Überprüfen, ob die Personen bereits in FactGrid bestehen

Das Matching gab im vorliegenden Fall nur drei Treffer, die weiter unten im Alphabet folgten. Bei ihnen setzten wir die Q-Nummern in die blaue Spalte und glichen die Labels ab.

Die Personen anlegen

Das Anlegen von Personen ist über CSV Tabellen übersichtlich durchführbar, bei allen weiteren Eingaben bevorzuge ich in QuickStatements die Version 1-Eingabe bei der direkt vom Tabellenblatt eingegeben wird.

  1. Für die CSV-Eingabe muss aus den Spalten D-K eine CSV Tabelle erstellt werden.
  2. Dabei müssen die Text-Spalten D-F Anführungsstriche erhalten. Im Google Spreadsheet geht das mit Ctrl+H und den Variablen ^ für Zellenbeginn und $ für Zellenende in Wechselbefehlen bei denen "Search using regular expressions" anzuklicken ist.
  3. Wenn die Namen in den Spalten D-F alle in Anführungsstrichen stehen, kann man die Spalten B-K markieren und in einem Notepad die Tabulatorstellen zwischen den Werten durch Kommata ersetzen. Man hat danach eine CSV-Datei, eine Datei mit Comma-Separated-Values. Zur Demonstration lege ich diese umgeformte Datei hier im Google Sheet ab
  4. Im FactGrid Menü QuickStatements öffnen, dort die CSV-Datei im Eingabefenster ablegen. (Bei der erstmaligen Bedienung wird eine Aufforderung sich einzuloggen erfolgen.)
  5. Auf CSV-Input klicken und überprüfen, ob die Eingabe wie gewünscht geschieht und dann mit Import CSV commands absenden.