FactGrid talk:Ukraine: Difference between revisions
Olaf Simons (talk | contribs) No edit summary |
Olaf Simons (talk | contribs) |
||
Line 12: | Line 12: | ||
* Alle angelegten Orte haben Geokoordinaten, es schien mir gefährlich, Orte ohne Koordinaten anzulegen, da diese nachher in größerer Menge nicht einzeln nachgetragen werden). | * Alle angelegten Orte haben Geokoordinaten, es schien mir gefährlich, Orte ohne Koordinaten anzulegen, da diese nachher in größerer Menge nicht einzeln nachgetragen werden). | ||
Der Datensatz hat eine Reihe von Mängeln: | |||
=== KOATUU- und IDs und KATOTTH-IDs == | |||
Das Ukrainische Statistikamt gab bis 2020 KOATUU-IDs für seine Orte und Verwaltungseinheiten. Das 2020 eingeführte neue System sind die KATOTTH IDs - hier erklärt: https://de.wikipedia.org/wiki/KATOTTH | |||
Auf der Wikipedia-Seite wird eine Excel-Liste verlinkt, die ich nicht abrufen konnte. Frage: kann man auf Ukrainischer Seite diese Nummern abrufen, kann man direkt in Datensätze verlinken. Wenn ja, sollten wir ein Matching durchführen und KATHOT-Ids setzen. | |||
Die KOATUU-ID ist [[Propertry:P1026]] und bislang ohne eine Formatter URL (mit der man auf Datensätze direkt uns einzeln zugreifen könnte), die KATOTTH IDs haben noch keine Property (Verlinkungen und das Property-Muster gibt es bei Wikidata: https://www.wikidata.org/wiki/Property:P9435 (auch dort ohne Formatter-URL). --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Transliteration === | |||
Die Label/Bezeichnungen der Orte sind bislang in den Sprachen Deutsch, Englisch, Französisch, Spanisch und Ukrainisch gegeben. Russisch sollten wir hinzusetzen (kann man aus WD ziehen). Die Transliteration ist bislang von Wikidata übernommen. Wo bislang eine Transliteration generierte ich sie mit | |||
* https://translit.ukraine-nachrichten.de/ - dort gibt es verschiedene Systeme und die Chance, Daten-Massen zu transliterieren. | |||
Die Frage ist, wie wir transliterieren wollen. Deutsch etwa ist bislang Duden-Standard, nicht wissenschaftlicher Standard. Wenn wir eine Neu-Transliteration durchführen, dann sollten die bestehenden Transliterationen auf die Alias-Position verschoben werden. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== "Descriptions"/"Beschreibungen" === | |||
Jedes Wikibase-Objekt braucht ein "Label"/"Bezeichnung": das Lemma - und eine "Beschreibung"/"Description". Die "Beschreibung" ist wichtig, da es zum Beispiel allein 80 Orte mit dem Namen Калинівка gibt. Mit den Beschreibungen werden sie Nutzerorientiert auseinandergehalten (datenbankseitig halten die Geokoordinaten sie sehr viel besser auseinander). | |||
Die Beschreibungstexte sind dabei politisch heikel und historisch wackelig. Wikidata gibt bevorzugt den Raion und den Oblast an, doch hier fanden erhebliche Umstrukturierungen statt. Politisch sensibel ist der Status in den russisch besetzten Gebieten, insbesondere auf der Krim. Mann will hier eigentlich keine "Beschreibungen, die man je nach Kriegsverlauf und Verwaltungs-Umsetzung laufend neu einspielen muss. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Verwaltungsgliederung === | |||
Nicht eingespielt sind Raions und Oblasts. Es würde genügen die Raions an die Orte zu koppeln und die Raions wiederum den Oblasten zuzuordnen, damit könnte man dann genauso die Oblaste (durch die Raon-Angabe hindurch) abfragen. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Data Connectivity === | |||
Wir sollten uns hier mit dem Herder-Institut beraten - und vielleicht mit ihnen danach überhaupt unsere Ost-Europa Sektion abstimmen. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Ukrainische Nutzung === | |||
Ein Desiderat. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) |
Revision as of 10:22, 29 January 2024
The villages, towns and cities of Ukraine
Arbeitsstand: Ich generierte im ersten Schritt etwa 28,000 Ukrainian Ort aus dem Fundus von Wikidata. Wikidata als Quelle hatte den Vorteil der breiten Vernetzung in andere Datenbanken, der Ausstattung mit Geokoordinaten und der Einbettung in das Wikipedia-Geflecht.
- Alle ausgewählten Orte sollten in die Kategorie (ehemals) bewohnter Siedlungskomplexe fallen: Weiler, Dörfer, Städte.
- Alle sind mit der KOATUU-ID ausgestattet, wo in Wikidata erfasst auch mit GND und GeoNames-IDs.
- Alle angelegten Orte haben Geokoordinaten, es schien mir gefährlich, Orte ohne Koordinaten anzulegen, da diese nachher in größerer Menge nicht einzeln nachgetragen werden).
Der Datensatz hat eine Reihe von Mängeln:
= KOATUU- und IDs und KATOTTH-IDs
Das Ukrainische Statistikamt gab bis 2020 KOATUU-IDs für seine Orte und Verwaltungseinheiten. Das 2020 eingeführte neue System sind die KATOTTH IDs - hier erklärt: https://de.wikipedia.org/wiki/KATOTTH
Auf der Wikipedia-Seite wird eine Excel-Liste verlinkt, die ich nicht abrufen konnte. Frage: kann man auf Ukrainischer Seite diese Nummern abrufen, kann man direkt in Datensätze verlinken. Wenn ja, sollten wir ein Matching durchführen und KATHOT-Ids setzen.
Die KOATUU-ID ist Propertry:P1026 und bislang ohne eine Formatter URL (mit der man auf Datensätze direkt uns einzeln zugreifen könnte), die KATOTTH IDs haben noch keine Property (Verlinkungen und das Property-Muster gibt es bei Wikidata: https://www.wikidata.org/wiki/Property:P9435 (auch dort ohne Formatter-URL). --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Transliteration
Die Label/Bezeichnungen der Orte sind bislang in den Sprachen Deutsch, Englisch, Französisch, Spanisch und Ukrainisch gegeben. Russisch sollten wir hinzusetzen (kann man aus WD ziehen). Die Transliteration ist bislang von Wikidata übernommen. Wo bislang eine Transliteration generierte ich sie mit
- https://translit.ukraine-nachrichten.de/ - dort gibt es verschiedene Systeme und die Chance, Daten-Massen zu transliterieren.
Die Frage ist, wie wir transliterieren wollen. Deutsch etwa ist bislang Duden-Standard, nicht wissenschaftlicher Standard. Wenn wir eine Neu-Transliteration durchführen, dann sollten die bestehenden Transliterationen auf die Alias-Position verschoben werden. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
"Descriptions"/"Beschreibungen"
Jedes Wikibase-Objekt braucht ein "Label"/"Bezeichnung": das Lemma - und eine "Beschreibung"/"Description". Die "Beschreibung" ist wichtig, da es zum Beispiel allein 80 Orte mit dem Namen Калинівка gibt. Mit den Beschreibungen werden sie Nutzerorientiert auseinandergehalten (datenbankseitig halten die Geokoordinaten sie sehr viel besser auseinander).
Die Beschreibungstexte sind dabei politisch heikel und historisch wackelig. Wikidata gibt bevorzugt den Raion und den Oblast an, doch hier fanden erhebliche Umstrukturierungen statt. Politisch sensibel ist der Status in den russisch besetzten Gebieten, insbesondere auf der Krim. Mann will hier eigentlich keine "Beschreibungen, die man je nach Kriegsverlauf und Verwaltungs-Umsetzung laufend neu einspielen muss. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Verwaltungsgliederung
Nicht eingespielt sind Raions und Oblasts. Es würde genügen die Raions an die Orte zu koppeln und die Raions wiederum den Oblasten zuzuordnen, damit könnte man dann genauso die Oblaste (durch die Raon-Angabe hindurch) abfragen. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Data Connectivity
Wir sollten uns hier mit dem Herder-Institut beraten - und vielleicht mit ihnen danach überhaupt unsere Ost-Europa Sektion abstimmen. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Ukrainische Nutzung
Ein Desiderat. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)