FactGrid talk:Ukraine
Jump to navigation
Jump to search
The villages, towns and cities of Ukraine
- the same data set in English
- map view (the Odessa oblast is missing due to the fact that the KOATUU-listings have been suppressed)
Arbeitsstand: Ich generierte im ersten Schritt etwa 28,000 Ukrainian Ort aus dem Fundus von Wikidata. Wikidata als Quelle hatte den Vorteil der breiten Vernetzung in andere Datenbanken, der Ausstattung mit Geokoordinaten und der Einbettung in das Wikipedia-Geflecht.
- Alle ausgewählten Orte sollten in die Kategorie (ehemals) bewohnter Siedlungskomplexe fallen: Weiler, Dörfer, Städte.
- Alle sind mit der KOATUU-ID ausgestattet, wo in Wikidata erfasst auch mit GND und GeoNames-IDs. Das Verfahren brachte ein blinden Fleck bei Orten des Oblasts Odessa, bei denen die KOATUU-ID in Wikidata unterdrückt wurde)
- Alle angelegten Orte haben Geokoordinaten, es schien mir gefährlich, Orte ohne Koordinaten anzulegen, da diese nachher in größerer Menge nicht einzeln nachgetragen werden).
Der Datensatz hat eine Reihe von Mängeln
- Die KOATUU-ID ist veraltet, die modernere seit 2020 gebräuchliche KATOTTH ID ist aber nur partiell notiert. (Hier die Abfrage aller Orte ohne KATOTTH ID). War die Wikidata-Community hier nachlässig? Kann man die Orte alle mit KATOTTH-Referenzen ausstatten? Hier müsste man mal auf die entsprechenden Ukrainischen Web-Angebote gehen, um nachzusehen, wie man die Ortsangaben optimal anbindet und referenziert. (Besonders schon wären stabile links in die Ukrainische Ressource, für die man die formatter-URL kennen müsste, siehe die GND als Muster).
- Die Label/Bezeichnungen der Orte sind in den Sprachen Deutsch, Englisch, Französisch und Spanisch mitgegeben, dabei holte ich verschiedene nationalsprachlichen Bezeichnungen aus Wikidata und wo sie fehlten (die Lücken waren in Deutsch, Französisch und Spanisch groß) aus dem Internet. Komfortabel war die Seite https://translit.ukraine-nachrichten.de/ mit ihrem parallelen Angebot verschiedener Transliterations-Systeme. Ich orientierte mich dabei daran, wie Wikidata die Transliteration in den verschiedenen Sprachen handhabte, um erst einmal konsistent zu bleiben.
- Die deutsche Transliteration folgt der (veralteten) Duden-Transkription. Wenn wir auf eine modernere Transkription gehen wollen, sollten wir die bisherige auf die Alian-Positionen verschieben. Eine moderne internationale Transkription ist nicht unbedingt nötig, da wir in einer mehrsprachigen Ressource arbeiten, bei der es genügen kann die englische Transkription nach dem internationalen Standard laufen zu lassen.
- Es mag klug sein, alle Orte Raions und diese wiederum den Oblasten zuzuordnen. Hierzu sollte eine konsistente Datengrundlage gefunden werden, und dann sollte man im selben Zug die Descriptions/Bezeichnungen neu gestalten. Aktuelle befinden sich die Notizen zur Lage nicht auf dem neuesten Stand.
- Wir sollten beim Thema Daten-Connectivity mit dem Herder-Institut Kontakt aufnehmen und für die deutsche Seite deren Rat einholen.
- Es wäre schick für die Ukrainische Seite des Projektes einen dortigen Kooperationspartner zu haben.
- Genial wäre es, historische Territorialzugehörigkeiten mit von-bis-Datierungen auf die Orte zu bekommen. --Olaf Simons (talk) 13:52, 26 January 2024 (CET)