User talk:David Löblich

From FactGrid
Revision as of 14:27, 5 February 2023 by David Löblich (talk | contribs) (→‎TO-DO-LIST: new section)
Jump to navigation Jump to search

Du weißt, wie Du neue, fehlende anlegst? Mit dem fertigen Batch Fragment, das Du zu Hunderten von Zeilen ausweiten kannst (siehe Menü), dann sind sie sauber und gleichmäßig mit Aussagen belegt. --Olaf Simons (talk) 19:04, 18 January 2023 (CET)

Für ein paar Namen hab ich das schon gemacht, hat gut funktioniert. Vielen Dank!
Und sieht gut aus. Wenn Du die Vornamen einlaufen lässt, setzen einen Qualifier P499 und notiere ob es erster, zweiter oder dritter Name ist. Unterschreiben übrigens kannst Du mit vier Tilden. --Olaf Simons (talk) 20:49, 18 January 2023 (CET)
Wenn Du Orte anlegst, ganz wichtig: Gibt die Wikidata-Nummer mit an ("wikidatawiki" bei andere Websites eingeben). Erstens kann man keine Dubletten bauen, da das System keine zwei Referenzen auf eine Wikidata-Nummer annimmt, zweitens kann man "föderierte Suchen" durch beide Instanzen laufen lassen, wenn sie miteinander verlinkt sind. Item:Q470907 Gruß --Olaf Simons (talk) 23:48, 18 January 2023 (CET)
Noch so eine Kleinigkeit: Wir brauchen immer auch eine englische Beschriftung der Labels. Die nämlich wird bei Nutzern anderer Sprachen ersatzweise angezeigt, wenn sie keine eigene Beschriftung vornehmen - für sie erscheint ansonsten an der Stelle nur eine Q-Nummer. --Olaf Simons (talk) 13:53, 19 January 2023 (CET)


Vielen Dank für den Hinweis! Das arbeite ich mit ein

Tische

Noch mein Tipp zu den Tischen. Lege sie einzeln an, verbinde sie miteinander über die Property organisatorischer Kontext verweis auf das Item "Freitisch der Stiftung".

Dann nutzt Du studentenseitig die Property P209 um auf den jeweiligen Tisch zu verlinken. Du kannst dabei Qualifier setzen: P49, P50 und P106 um zu erfassen, wer gleichzeitig sich gekannt haben könnte.

Du kannst im Gegenzug auch bei den Tischen spiegeln mit P726, wer an ihnen von wann bis wann saß (ist aber nicht nötig - indes für Dich übersichtlich). Grüße --Olaf Simons (talk) 00:11, 20 January 2023 (CET)

aus dem Betrieb genommene Properties

wieder ein kleiner Tipp: es gibt Properties, die in Rente gingen, weil wir die Datenmodellierung vereinheitlichten und wenn's geht einfacher machten - so <ist der Geburtsname von> (P147). Die in Rente gegangenen werden nicht vernichtet (so dass sie beim Versionsrückblick funktional bleiben), doch sind sie aus dem großen Verzeichnis herausgenommen und mit <> Klammern gekennzeichnet.

Bei Geburtsnamen notieren wir beide Namen unter der einheitlichen Property Familienname (so dass man die Person immer findet) und setzen dann mit P2 = Geburtsname einen Qualifier. Grüße, -Olaf Simons (talk) 16:33, 24 January 2023 (CET)

Vielen Dank für den Hinweis! Hatte mich schon ein wenig gewundert, aber jetzt weiß ich bescheid

P83 / P47

Kleine Notiz (Danke nebenbei für die Schulen). Wir setzen P83 wenn ein Objekt eine Ortsansässigkeit hat "Wohnort" und P47 für alle kleineren Lokalisierungen. Ob es klug ist, weiß ich nicht, vielleicht wäre auch eine einzelne Property gegangen. Dies die Musterabfrage, mit der Du nachsehen kannst, ob es eine Schule schon gibt. Guck Dir die Musterabfrage ob eines nützlichen Details an: (wdt:P2/(wdt:P3*)) wd:Q21414 fragt alle Gegenstände ab, bei denen Schule in P2 steht, aber auch solche, bei denen das Objekt erst in der Unterkategorisierung eine Schule ist. Man kann also auch sagen "ist ein Gymnasium" und bei Gymnasium mit P3 vermerken, dass das eine Schule ist. Das verstand ich Anfangs nicht, und so riskierten wir nicht die klareren P2-Aussagen. Grüße, --Olaf Simons (talk) 11:06, 1 February 2023 (CET)

Doppelte Geburtsdaten

Wenn wir divergierende Datierungen haben, können wir sie gegeneinander bewerten. Bei vielen Gymnasiasten Gothas gab ich einen Schätzwert an. Wenn Du das präzise Datum setzt, sind Dokument-Nennungen interessant (müsstest Du automatisch einspielen können). Und wenn Du über solche Datendivergenzen stolperst, dann werte meine Schätzdaten einfach herunter. Sie fallen damit aus Deinen Statistiken raus. Siehe Item:Q191991. Vielleicht sollten wir mal eine Abfrage machen und mit Excel die Doppeltnennungen herauskriegen... --Olaf Simons (talk) 08:35, 3 February 2023 (CET)


Das ist eine gute Idee, würde ich aber vielleicht eher am Ende machen, wenn ich alle meine Daten aus allen Quellen eingespielt hab, um doppelte Arbeit zu vermeiden. --David Löblich

Berufe und Berufsstatistik

Moin David. Du fragst nach einer guten Berufsstatistik aus Deinen Materialien.

Banal ist diese Abfrage:

Zu einer Statistik musst Du die Angaben bündeln und dann zählen und dann die entsprechende Grafik machen - etwa Bubble Chart. Dabei wird genau dieses Skript in ein entsprechendes zur Bündelung, Zählung und Auswertung gepackt. Das sieht dann so aus:

...ist aber nicht schön, weil da lauter kleine Berufe drinstecken, wo Dich doch eher interessieren würde, in was für Berufssparten die Leute arbeiteten. Der Schritt in diese Auswertung ist der folgende: Auf den Berufen notierst Du, welchen Sparten sie zugehören sollen, und dann machst Du eine Abfrage, die die Berufe durchgeht und auf den Berufs-Items die dortige Spartenzuweisung abfragt und dann aus dieser die schlüssigere Statistik macht. Erstmal nur die Abfrage Berufe und Spartenzuweisung:

Und jetzt kannst Du auch diese Zuweisung statistisch wie oben gezeigt einbetten und auswerten:

Sieh Dir die Skripten an, um sie grob zu verstehen, damit Du begreifst, was man alles machen kann. Man kann um die Ecke fragen, sprich von Personen zu Berufen zu Sparten. Es geht nur um die Möglichkeiten. Wie exakt geskriptet wird, kann ich mir selbst nicht merken, und hole es mir aus den Sample Queries, von wo ich dann Parameter (Q- und P-Nummern) austausche.

Soweit so gut - oder so weit so schlecht. Der Haken an dieser Statistik ist im Moment, dass sie - wie sagt man auf Englisch "make shift" - ist (ich denke zu viel auf Englisch). Ich habe einfach freihand Berufe einem Spartensystem zugeordnet, das ich eben so freihändig aufgestellt habe. Dies hier Item:Q22221 ist ein Beruf und P626 ist meine Spartenzuweisung. Das Berufsklassensystem findest Du hier Property:P626. Man will, dass ein Beruf nur eine Zuteilung bekommt, damit auch jeder Treffer nur einen Wert in der Bubble chart erhält, sonst verzerren Berufe mit zehn P626 statements die Statistik. Ich habe unsere Berufe nur rudimentär meinem gefühlsmäßigen System zugeordnet. Die Fachfrau für diese Frage sitzt bei Euch in Halle: Kartrin Möller. Sie könnte Dir zu dieser Liste:

viel professioneller als ich nicht nur eine, sondern gleich zehn Verteilungen auf Sparten geben, und wird wohl schmunzeln über meine hemdsärmlige Zuweisung von Berufen und Sparten.

Du kannst Dir eine Dir plausible Spartenverteilung ausdenken und ich baue Dir für Dein System eine Property; aber besser ist Forschung zu Spartenverteilungen. Also vielleicht mal bei Katrin Möller anklopfen und ihr diese Seite zeigen. Sie kann Dir auf Deine Tabelle zehn verschiedene Statistiken machen, je nachdem wie sie die Berufe versteht. Das ist ein kompliziertes Gebiet, in dem wir bislang nur austesteten, was die Maschine kann. Immerhin kannst Du wenigstens diese Statistik theoretisch in 400 Sprachen bekommen. Das ist ja schon mal ganz nett. Grüße Katrin Möller, wenn Du sie kontaktierst. Bei ihr klopfte ich an, als das FactGrid noch ein Projekt war, ich aber schon dachte, dass sie die Antworten auf Deine Fragen hat; und sie half mir, klarer zu ermessen, was auf uns alle mit diesem Projekt zukommt. --Olaf Simons (talk) 12:12, 4 February 2023 (CET)

PS: Um zu verstehen, wo ich Berufe nicht dem Schema zuordnete, braucht Du eine Abfrage mit OPTIONAL Komponenten:

Beschreibungen

Wenn Du die Informationen beisammen hast, wäre es günstig für Deine Leute "Beschreibungen" zu bauen. Je kürzer und griffiger desto besser.

* 1676-04-02 Halle, + 1745-12-03 Hamburg, Arzt

so dass man bei gleichnamigen Personen weiß, wen man anklicken soll. Ich ließ Dich erstmal Daten eingeben, denn jetzt kannst Du die Berufe in den verschiedenen Sprachen aus der Datenbank holen und die Informationen in der gewünschten Reihenfolge in Spalten bringen, die Du dann zum Dde- oder Den-Zelleninhalt zusammenfügst. --Olaf Simons (talk) 12:16, 5 February 2023 (CET)

Danke für den Hinweis, das mach ich im laufenden Prozess dann mit bei der weiteren Bearbietung --David Löblich 12:48, 5 February 2023 (CET)

TO-DO-LIST

- RESTLICHE SCHULORTE ANLEGEN UND MIT PERSONEN VERBINDEN - DATEN ZUGANG UND ABGANG FREITISCH GES. HOCHLADEN - SIGNATUREN D11a UND D11b ZU EINZELPERSONEN BRINGEN - BESCHREIBUNGEN ANLEGEN - ORTE MIT HISTORISCHEN REGIONEN VERBINDEN - STERBEDATEN UND -ORTE AUS TABELLE - SPALTE "SONSTIGES" - ERGEBNISSE AUS FRANCKES SCHULEN - ZUGANG FREITISCH 2-3 - EINZELTISCHE ANLEGEN: VERKNÜPFUNGEN BEI STUDENTEN UND AN TISCHEN - LISTE TISCHE FÜR 1702-1709 JETZT AUSWERTBAR? D11f - D11k anlegen und Signaturen zuführen, wo schon in Factgrid - weitere Jahre aufnehmen? - STAMMBUCH PETRUS MAHLER AUFNEHMEN und Daten aufbereiten, neue Personen recherchieren in bbr und Matrikeln - D11c anlegen und fehlende Jahre? - Verknüpfung als Quelle zu einelnen Tischen

- Langfristig möglich: weitere/spätere Freitischlervz., Matrikel, sonstige Tischlisten und serielle Quellen AFSt (z.B. Konferenzpr., Adressbuch Rost), Waisen, Schüler, Informatoren