FactGrid talk:Ukraine: Difference between revisions
Olaf Simons (talk | contribs) No edit summary |
Olaf Simons (talk | contribs) |
||
(10 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
== | == Orte der Ukraine == | ||
* [http://tinyurl.com/yl5hrva2 All Ukrainian places on FactGrid, basic data set] | * [http://tinyurl.com/yl5hrva2 All Ukrainian places on FactGrid, basic data set] | ||
Line 6: | Line 5: | ||
:* [http://tinyurl.com/ynn8cgjc map view] | :* [http://tinyurl.com/ynn8cgjc map view] | ||
FactGrid kennt mit Stand vom 17 April 2024 30036 georeferenzierte Siedlungsplätze in der Ukraine. Die Datengrundgrundlage waren alle [https://w.wiki/8$2i Wikidata Siedlungsorte mit einer KOATUU-ID]. Im Gegenzug wurden die Wikidata-Orte mit FactGrid-IDs ausgestattet, was es einfach Macht, Informationen von dort zu beziehen und ohne ein weiteres externes Matching mit Aussagen zu versehen. | |||
Ein Desiderat ist im Moment die Aufteilung in die Verwaltungseinheiten und die Historisierung des Datenbestands. | |||
=== KOATUU- und IDs und KATOTTH-IDs === | |||
Das Ukrainische Statistikamt gab bis 2020 KOATUU-IDs für seine Orte und Verwaltungseinheiten. Das 2020 eingeführte neue System sind die KATOTTH IDs - hier erklärt: https://de.wikipedia.org/wiki/KATOTTH | |||
Auf der ukrainischen Seite "Dezentralisierung" gibt es eine vollständige Liste mit allen neuen KATOTTH-IDs für das gesamte Territorium der Ukraine: https://decentralization.ua/news/13151. Dort werden alle Ortschaften in fünf Ebenen eingeteilt und mit IDs versehen: | |||
# Die Ebene der Oblaste (einschließlich der autonomen Republik Krim) und der Städte, die einen speziellen Status haben | |||
# Die Rajone in den Oblasten und der Autonomen Republik Krim | |||
# Die Territorien der Territorialgemeinden in den Oblasten und der Autonomen Republik Krim | |||
# Die Städte, Dörfer und Gemeinden (ungenaue Übersetzung von "селища") | |||
# Zusätzliche Ebene: Stadtviertel bzw. -teile | |||
Außerdem gibt es dort eine Vergleichstabelle in der alle neuen KATOTTH-IDs mit den alten KOATUU-IDs gematcht sind. | |||
Hier sind alle Ortschaften bzw. KATOTTH-IDs über eine Online-Datenbank zu recherchieren (größtenteils mit Geokoordinaten): https://directory.org.ua/ | |||
Ein erstes Matching hat 22.993 Ortschaften mit KOATUU-IDs mit den neuen KATOTTH-IDs versehen. | |||
Stand 12.02.2024 sind die ersten 5100 Ortschaften in Factgrid mit den neuen KATOTTH-IDs versehen (bis einschließlich Дніпровокам’янка, Q711158). | |||
Erstes Problem: Das Matching hat die Oblaste, Rajone und Territorialgemeinden automatisch zu den Q-Nummern der jeweiligen namensgebenden Städte hinzugefügt. Somit hat bspw. der Eintrag zu "Odesa" nun zwei KATOTTH-IDs: Einmal zur Stadt an sich und einmal für den "Odeska Oblast". | |||
Die KOATUU-ID ist [[Property:P1026]] und bislang ohne eine Formatter URL (mit der man auf Datensätze direkt und einzeln zugreifen könnte), die KATOTTH IDs ist [[Property:P1050]]. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Transliteration === | |||
Die Label/Bezeichnungen der Orte sind bislang in den Sprachen Deutsch, Englisch, Französisch, Spanisch und Ukrainisch gegeben. Russisch sollten wir hinzusetzen (kann man aus WD ziehen). Die Transliteration ist bislang von Wikidata übernommen. Wo bislang eine Transliteration generierte ich sie mit | |||
* https://translit.ukraine-nachrichten.de/ - dort gibt es verschiedene Systeme und die Chance, Daten-Massen zu transliterieren. | |||
Die Frage ist, wie wir transliterieren wollen. Deutsch etwa ist bislang Duden-Standard, nicht wissenschaftlicher Standard. Wenn wir eine Neu-Transliteration durchführen, dann sollten die bestehenden Transliterationen auf die Alias-Position verschoben werden. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== "Descriptions"/"Beschreibungen" === | |||
Jedes Wikibase-Objekt braucht ein "Label"/"Bezeichnung": das Lemma - und eine "Beschreibung"/"Description". Die "Beschreibung" ist wichtig, da es zum Beispiel allein 80 Orte mit dem Namen Калинівка gibt. Mit den Beschreibungen werden sie Nutzerorientiert auseinandergehalten (datenbankseitig halten die Geokoordinaten sie sehr viel besser auseinander). | |||
Die Beschreibungstexte sind dabei politisch heikel und historisch wackelig. Wikidata gibt bevorzugt den Raion und den Oblast an, doch hier fanden erhebliche Umstrukturierungen statt. Politisch sensibel ist der Status in den russisch besetzten Gebieten, insbesondere auf der Krim. Mann will hier eigentlich keine "Beschreibungen, die man je nach Kriegsverlauf und Verwaltungs-Umsetzung laufend neu einspielen muss. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Verwaltungsgliederung === | |||
Nicht eingespielt sind Raions und Oblasts. Es würde genügen die Raions an die Orte zu koppeln und die Raions wiederum den Oblasten zuzuordnen, damit könnte man dann genauso die Oblaste (durch die Raon-Angabe hindurch) abfragen. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== Data Connectivity === | |||
Wir sollten uns hier mit dem Herder-Institut beraten - und vielleicht mit ihnen danach überhaupt unsere Ost-Europa Sektion abstimmen. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
=== | === Ukrainische Nutzung === | ||
Ein Desiderat. --[[User:Olaf Simons|Olaf Simons]] ([[User talk:Olaf Simons|talk]]) 10:22, 29 January 2024 (CET) | |||
Latest revision as of 10:12, 17 April 2024
Orte der Ukraine
FactGrid kennt mit Stand vom 17 April 2024 30036 georeferenzierte Siedlungsplätze in der Ukraine. Die Datengrundgrundlage waren alle Wikidata Siedlungsorte mit einer KOATUU-ID. Im Gegenzug wurden die Wikidata-Orte mit FactGrid-IDs ausgestattet, was es einfach Macht, Informationen von dort zu beziehen und ohne ein weiteres externes Matching mit Aussagen zu versehen.
Ein Desiderat ist im Moment die Aufteilung in die Verwaltungseinheiten und die Historisierung des Datenbestands.
KOATUU- und IDs und KATOTTH-IDs
Das Ukrainische Statistikamt gab bis 2020 KOATUU-IDs für seine Orte und Verwaltungseinheiten. Das 2020 eingeführte neue System sind die KATOTTH IDs - hier erklärt: https://de.wikipedia.org/wiki/KATOTTH
Auf der ukrainischen Seite "Dezentralisierung" gibt es eine vollständige Liste mit allen neuen KATOTTH-IDs für das gesamte Territorium der Ukraine: https://decentralization.ua/news/13151. Dort werden alle Ortschaften in fünf Ebenen eingeteilt und mit IDs versehen:
- Die Ebene der Oblaste (einschließlich der autonomen Republik Krim) und der Städte, die einen speziellen Status haben
- Die Rajone in den Oblasten und der Autonomen Republik Krim
- Die Territorien der Territorialgemeinden in den Oblasten und der Autonomen Republik Krim
- Die Städte, Dörfer und Gemeinden (ungenaue Übersetzung von "селища")
- Zusätzliche Ebene: Stadtviertel bzw. -teile
Außerdem gibt es dort eine Vergleichstabelle in der alle neuen KATOTTH-IDs mit den alten KOATUU-IDs gematcht sind.
Hier sind alle Ortschaften bzw. KATOTTH-IDs über eine Online-Datenbank zu recherchieren (größtenteils mit Geokoordinaten): https://directory.org.ua/
Ein erstes Matching hat 22.993 Ortschaften mit KOATUU-IDs mit den neuen KATOTTH-IDs versehen. Stand 12.02.2024 sind die ersten 5100 Ortschaften in Factgrid mit den neuen KATOTTH-IDs versehen (bis einschließlich Дніпровокам’янка, Q711158).
Erstes Problem: Das Matching hat die Oblaste, Rajone und Territorialgemeinden automatisch zu den Q-Nummern der jeweiligen namensgebenden Städte hinzugefügt. Somit hat bspw. der Eintrag zu "Odesa" nun zwei KATOTTH-IDs: Einmal zur Stadt an sich und einmal für den "Odeska Oblast".
Die KOATUU-ID ist Property:P1026 und bislang ohne eine Formatter URL (mit der man auf Datensätze direkt und einzeln zugreifen könnte), die KATOTTH IDs ist Property:P1050. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Transliteration
Die Label/Bezeichnungen der Orte sind bislang in den Sprachen Deutsch, Englisch, Französisch, Spanisch und Ukrainisch gegeben. Russisch sollten wir hinzusetzen (kann man aus WD ziehen). Die Transliteration ist bislang von Wikidata übernommen. Wo bislang eine Transliteration generierte ich sie mit
- https://translit.ukraine-nachrichten.de/ - dort gibt es verschiedene Systeme und die Chance, Daten-Massen zu transliterieren.
Die Frage ist, wie wir transliterieren wollen. Deutsch etwa ist bislang Duden-Standard, nicht wissenschaftlicher Standard. Wenn wir eine Neu-Transliteration durchführen, dann sollten die bestehenden Transliterationen auf die Alias-Position verschoben werden. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
"Descriptions"/"Beschreibungen"
Jedes Wikibase-Objekt braucht ein "Label"/"Bezeichnung": das Lemma - und eine "Beschreibung"/"Description". Die "Beschreibung" ist wichtig, da es zum Beispiel allein 80 Orte mit dem Namen Калинівка gibt. Mit den Beschreibungen werden sie Nutzerorientiert auseinandergehalten (datenbankseitig halten die Geokoordinaten sie sehr viel besser auseinander).
Die Beschreibungstexte sind dabei politisch heikel und historisch wackelig. Wikidata gibt bevorzugt den Raion und den Oblast an, doch hier fanden erhebliche Umstrukturierungen statt. Politisch sensibel ist der Status in den russisch besetzten Gebieten, insbesondere auf der Krim. Mann will hier eigentlich keine "Beschreibungen, die man je nach Kriegsverlauf und Verwaltungs-Umsetzung laufend neu einspielen muss. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Verwaltungsgliederung
Nicht eingespielt sind Raions und Oblasts. Es würde genügen die Raions an die Orte zu koppeln und die Raions wiederum den Oblasten zuzuordnen, damit könnte man dann genauso die Oblaste (durch die Raon-Angabe hindurch) abfragen. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Data Connectivity
Wir sollten uns hier mit dem Herder-Institut beraten - und vielleicht mit ihnen danach überhaupt unsere Ost-Europa Sektion abstimmen. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)
Ukrainische Nutzung
Ein Desiderat. --Olaf Simons (talk) 10:22, 29 January 2024 (CET)