FactGrid talk:Vocabularies: Difference between revisions

From FactGrid
Jump to navigation Jump to search
 
(4 intermediate revisions by one other user not shown)
Line 33: Line 33:
** [https://dhistory.hypotheses.org/digital-history-tagung-2023/session-4 Sundzollregister / Sundzolltabellen], darin verzeichnet Orte und Steuerbegriffe
** [https://dhistory.hypotheses.org/digital-history-tagung-2023/session-4 Sundzollregister / Sundzolltabellen], darin verzeichnet Orte und Steuerbegriffe


*Vornamen (Katrin Moeller)
*Todesurachen / Krankheitsbezeichnungen (Katja)
 
*Verbrechen und Kriminaldelikte (Anne)
 
* [[FactGrid:Given Names|Vornamen]] (Katrin Moeller)


*Ausdrücke für Unsicherheiten  
*Ausdrücke für Unsicherheiten  
Line 41: Line 45:
**[https://zenodo.org/record/1402373#.ZHcBHaXP1PY Academic Meta Tool]
**[https://zenodo.org/record/1402373#.ZHcBHaXP1PY Academic Meta Tool]


== Software zum Ansehen und Testen ==
== Software und Tools zum Ansehen und Testen ==


[https://ahkde.github.io/docs/v1/misc/RegEx-QuickRef.htm RegEx] sucht nach reguläre Ausdrücken und damit nach Mustern im Text. Kann verwendet werden, um Text zu finden und zu ersetzen, Daten zu analysieren, Eingaben zu überprüfen, Suchen durchzuführen etc.
*[https://ahkde.github.io/docs/v1/misc/RegEx-QuickRef.htm RegEx] sucht nach reguläre Ausdrücken und damit nach Mustern im Text. Kann verwendet werden, um Text zu finden und zu ersetzen, Daten zu analysieren, Eingaben zu überprüfen, Suchen durchzuführen etc.
*[https://www.dnb.de/DE/Professionell/Metadatendienste/Datenbezug/Entity-Facts/entityFacts_node.html Entity Facts] ist ein Datendienst der Deutschen Nationalbibliothek, der maschinenlesbare „Faktenblätter“ zu Entitäten der Gemeinsamen Normdatei (GND) bereitstellt. Der Dienst macht die Informationen aus der GND auch ohne Kenntnisse bibliothekarischer Datenformate und Erfassungskonventionen nutzbar. Die Daten werden im Format JavaScript Object Notation (JSON) ausgeliefert. Die Aufbereitung der Daten ist für die direkte Anzeige oder Indexierung in anderen Anwendungen optimiert. Die Daten können aktuell nur mittels GND-Identifier abgefragt werden. Weitere Suchoptionen sind durch die Integration in die Datenschnittstellen der Deutschen Nationalbibliothek möglich.


== Literatur zum Ansehen und Lesen ==
== Literatur zum Ansehen und Lesen ==

Latest revision as of 21:57, 20 April 2024

Qualitäten von Vokabularen

  • Wie steht es um die Übersetzbarkeit in anderen Sprachen
  • Wie steht es um die Binnenstrukturierung - Hierarchien
  • Wie maschinenlesbar ist was hier an Vokabeln gegebenen ist - gibt es maschinenlesbare Aussagen zu den Vokabeln?)
  • Welchen Gebrauch soll man vom jeweiligen Vokabular machen?
  • Wer nutzt diese Vokabular?
  • Wie schwierig ist in Matching? Gib es external Identifier?


Weitere Ideen für Vokabulare

  • Vokabular zu Typografie / Schriftarten
    • Forderung nach Ontologie für Layouterkennung
  • Bildsemantik für Druckgraphik / Alltagsgraphik
    • Vokabular für Bildbeschreibung
  • Todesurachen / Krankheitsbezeichnungen (Katja)
  • Verbrechen und Kriminaldelikte (Anne)
  • Ausdrücke für Unsicherheiten
    • Uncertainty Ontology. Die W3C Uncertainty Ontology (un) basiert darauf, dass eine Aussage (un:Sentence) mit einer Unsicherheit behaftet ist (un:Uncertainty), welche unterschiedliche Ausprägungen besitzt: un:UncertaintyType (Klassifikation der Unsicherheit, wie Ambiguity, Empirical, Vagueness, Inconsistency, Incompleteness), un:UncertaintyNature (Aleatory oder Epistemic), un:UncertaintyDerivation (Angaben, wie die Unsicherheit entstanden ist, z.B. objektiv oder subjektiv) und un:UncertaintyModel (mathematische Theorien für Uncertainty Types wie Probability oder RandomSets).

Software und Tools zum Ansehen und Testen

  • RegEx sucht nach reguläre Ausdrücken und damit nach Mustern im Text. Kann verwendet werden, um Text zu finden und zu ersetzen, Daten zu analysieren, Eingaben zu überprüfen, Suchen durchzuführen etc.
  • Entity Facts ist ein Datendienst der Deutschen Nationalbibliothek, der maschinenlesbare „Faktenblätter“ zu Entitäten der Gemeinsamen Normdatei (GND) bereitstellt. Der Dienst macht die Informationen aus der GND auch ohne Kenntnisse bibliothekarischer Datenformate und Erfassungskonventionen nutzbar. Die Daten werden im Format JavaScript Object Notation (JSON) ausgeliefert. Die Aufbereitung der Daten ist für die direkte Anzeige oder Indexierung in anderen Anwendungen optimiert. Die Daten können aktuell nur mittels GND-Identifier abgefragt werden. Weitere Suchoptionen sind durch die Integration in die Datenschnittstellen der Deutschen Nationalbibliothek möglich.

Literatur zum Ansehen und Lesen

Links