FactGrid talk:Ukraine: Difference between revisions

From FactGrid
Jump to navigation Jump to search
(Created page with "== The villages, towns and cities of Ukraine == Arbeitsstand: Ich generierte im ersten Schritt etwa 28,000 Ukrainian Ort aus dem Fundus von Wikidata. Wikidata als Quelle hatte den Vorteil der breiten Vernetzung in andere Datenbanken, der Ausstattung mit Geokoordinaten und der Einbettung in das Wikipedia-Geflecht. * Alle ausgewählten Orte sollten in die Kategorie (ehemals) bewohnter Siedlungskomplexe fallen: Weiler, Dörfer, Städte. * Alle sind mit der KOATUU ID ausge...")
 
Line 9: Line 9:
Der Datensatz hat eine Reihe von Mängeln:
Der Datensatz hat eine Reihe von Mängeln:


* Die KOATUU-ID ist veraltet, die modernere seit 2020 gebräuchliche KATOTTH ID ist nur partiell notiert. (Hier die Abfrage aller Orte ohne KATOTTH ID). War die Wikidata-Community hier nachlässig? Kann man die Orte alle mit KATOTTH-Referenzen ausstatten? Hier müsste man mal auf die entsprechenden Ukrainischen Web-Angebote gehen, um nachzusehen, wie man die Ortsangaben optimal anbindet und referenziert. (Besonders schon wären stabile links in die Ukrainische Ressource, für die man die formatter-URL kennen müsste, siehe die [[Preoperty:P76|GND]] als Muster).
* Die KOATUU-ID ist veraltet, die modernere seit 2020 gebräuchliche KATOTTH ID ist nur partiell notiert. (Hier die Abfrage aller Orte ohne KATOTTH ID). War die Wikidata-Community hier nachlässig? Kann man die Orte alle mit KATOTTH-Referenzen ausstatten? Hier müsste man mal auf die entsprechenden Ukrainischen Web-Angebote gehen, um nachzusehen, wie man die Ortsangaben optimal anbindet und referenziert. (Besonders schon wären stabile links in die Ukrainische Ressource, für die man die formatter-URL kennen müsste, siehe die [[Property:P76|GND]] als Muster).
* Die Label/Bezeichnungen der Orte sind in den Sprachen Deutsch, Englisch, Französisch und Spanisch mitgegeben, dabei holte ich verschiedene nationalsprachlichen Bezeichnungen aus Wikidata und wo sie fehlten (die Lücken waren in Deutsch, Französisch und Spanisch groß) aus dem Internet. Komfortabel war die Seite https://translit.ukraine-nachrichten.de/ mit ihrem parallelen Angebot verschiedener Transliterations-Systeme. Ich orientierte mich dabei daran, wie Wikidata die Transliteration in den verschiedenen Sprachen handhabte, um erst einmal konsistent zu bleiben.
* Die Label/Bezeichnungen der Orte sind in den Sprachen Deutsch, Englisch, Französisch und Spanisch mitgegeben, dabei holte ich verschiedene nationalsprachlichen Bezeichnungen aus Wikidata und wo sie fehlten (die Lücken waren in Deutsch, Französisch und Spanisch groß) aus dem Internet. Komfortabel war die Seite https://translit.ukraine-nachrichten.de/ mit ihrem parallelen Angebot verschiedener Transliterations-Systeme. Ich orientierte mich dabei daran, wie Wikidata die Transliteration in den verschiedenen Sprachen handhabte, um erst einmal konsistent zu bleiben.
:* Die deutsche Transliteration folgt der (veralteten) Duden-Transkription. Wenn wir auf eine modernere Transkription gehen wollen, sollten wir die bisherige auf die Alian-Positionen verschieben. Eine moderne internationale Transkription ist nicht unbedingt nötig, da wir in einer mehrsprachigen Ressource arbeiten, bei der es genügen kann die englische Transkription nach dem internationalen Standard laufen zu lassen.
:* Die deutsche Transliteration folgt der (veralteten) Duden-Transkription. Wenn wir auf eine modernere Transkription gehen wollen, sollten wir die bisherige auf die Alian-Positionen verschieben. Eine moderne internationale Transkription ist nicht unbedingt nötig, da wir in einer mehrsprachigen Ressource arbeiten, bei der es genügen kann die englische Transkription nach dem internationalen Standard laufen zu lassen.
* Raions
* Raions

Revision as of 14:47, 26 January 2024

The villages, towns and cities of Ukraine

Arbeitsstand: Ich generierte im ersten Schritt etwa 28,000 Ukrainian Ort aus dem Fundus von Wikidata. Wikidata als Quelle hatte den Vorteil der breiten Vernetzung in andere Datenbanken, der Ausstattung mit Geokoordinaten und der Einbettung in das Wikipedia-Geflecht.

  • Alle ausgewählten Orte sollten in die Kategorie (ehemals) bewohnter Siedlungskomplexe fallen: Weiler, Dörfer, Städte.
  • Alle sind mit der KOATUU ID ausgestattet, wo in Wikidata erfasst auch mit GND und GeoNames-IDs.
  • Alle angelegten Orte haben Geokoordinaten es schien mir gefährlich, Orte ohne Koordinaten anzulegen, da diese nachher in größerer Menge nicht einzeln nachgetragen werden).

Der Datensatz hat eine Reihe von Mängeln:

  • Die KOATUU-ID ist veraltet, die modernere seit 2020 gebräuchliche KATOTTH ID ist nur partiell notiert. (Hier die Abfrage aller Orte ohne KATOTTH ID). War die Wikidata-Community hier nachlässig? Kann man die Orte alle mit KATOTTH-Referenzen ausstatten? Hier müsste man mal auf die entsprechenden Ukrainischen Web-Angebote gehen, um nachzusehen, wie man die Ortsangaben optimal anbindet und referenziert. (Besonders schon wären stabile links in die Ukrainische Ressource, für die man die formatter-URL kennen müsste, siehe die GND als Muster).
  • Die Label/Bezeichnungen der Orte sind in den Sprachen Deutsch, Englisch, Französisch und Spanisch mitgegeben, dabei holte ich verschiedene nationalsprachlichen Bezeichnungen aus Wikidata und wo sie fehlten (die Lücken waren in Deutsch, Französisch und Spanisch groß) aus dem Internet. Komfortabel war die Seite https://translit.ukraine-nachrichten.de/ mit ihrem parallelen Angebot verschiedener Transliterations-Systeme. Ich orientierte mich dabei daran, wie Wikidata die Transliteration in den verschiedenen Sprachen handhabte, um erst einmal konsistent zu bleiben.
  • Die deutsche Transliteration folgt der (veralteten) Duden-Transkription. Wenn wir auf eine modernere Transkription gehen wollen, sollten wir die bisherige auf die Alian-Positionen verschieben. Eine moderne internationale Transkription ist nicht unbedingt nötig, da wir in einer mehrsprachigen Ressource arbeiten, bei der es genügen kann die englische Transkription nach dem internationalen Standard laufen zu lassen.
  • Raions