FactGrid talk:Vocabularies

From FactGrid
Jump to navigation Jump to search

Qualitäten von Vokabularen

  • Wie steht es um die Übersetzbarkeit in anderen Sprachen
  • Wie steht es um die Binnenstrukturierung - Hierarchien
  • Wie maschinenlesbar ist was hier an Vokabeln gegebenen ist - gibt es maschinenlesbare Aussagen zu den Vokabeln?)
  • Welchen Gebrauch soll man vom jeweiligen Vokabular machen?
  • Wer nutzt diese Vokabular?
  • Wie schwierig ist in Matching? Gib es external Identifier?


Weitere Ideen für Vokabulare

  • Vokabular zu Typografie / Schriftarten
    • Forderung nach Ontologie für Layouterkennung
  • Bildsemantik für Druckgraphik / Alltagsgraphik
    • Vokabular für Bildbeschreibung
  • Todesurachen / Krankheitsbezeichnungen (Katja)
  • Verbrechen und Kriminaldelikte (Anne)
  • Vornamen (Katrin Moeller)
  • Ausdrücke für Unsicherheiten
    • Uncertainty Ontology. Die W3C Uncertainty Ontology (un) basiert darauf, dass eine Aussage (un:Sentence) mit einer Unsicherheit behaftet ist (un:Uncertainty), welche unterschiedliche Ausprägungen besitzt: un:UncertaintyType (Klassifikation der Unsicherheit, wie Ambiguity, Empirical, Vagueness, Inconsistency, Incompleteness), un:UncertaintyNature (Aleatory oder Epistemic), un:UncertaintyDerivation (Angaben, wie die Unsicherheit entstanden ist, z.B. objektiv oder subjektiv) und un:UncertaintyModel (mathematische Theorien für Uncertainty Types wie Probability oder RandomSets).

Software und Tools zum Ansehen und Testen

  • RegEx sucht nach reguläre Ausdrücken und damit nach Mustern im Text. Kann verwendet werden, um Text zu finden und zu ersetzen, Daten zu analysieren, Eingaben zu überprüfen, Suchen durchzuführen etc.
  • Entity Facts ist ein Datendienst der Deutschen Nationalbibliothek, der maschinenlesbare „Faktenblätter“ zu Entitäten der Gemeinsamen Normdatei (GND) bereitstellt. Der Dienst macht die Informationen aus der GND auch ohne Kenntnisse bibliothekarischer Datenformate und Erfassungskonventionen nutzbar. Die Daten werden im Format JavaScript Object Notation (JSON) ausgeliefert. Die Aufbereitung der Daten ist für die direkte Anzeige oder Indexierung in anderen Anwendungen optimiert. Die Daten können aktuell nur mittels GND-Identifier abgefragt werden. Weitere Suchoptionen sind durch die Integration in die Datenschnittstellen der Deutschen Nationalbibliothek möglich.

Literatur zum Ansehen und Lesen

Links