Help:Wie führe ich Datendubletten im FactGrid zusammen?

From FactGrid
Jump to navigation Jump to search

Zurück

Insbesondere beim automatisierten Anlegen von Datenbankobjekten kommt es oft zur Anlage von Dubletten. Man überprüfte nicht genau genug, ob es ein Item zu diesem Objekt bereits gab, oder erkannte dieses nicht, da es leicht anders betitelt war.

In diesem Fall lassen sich Items zusammenführen:

Das Ziel-Item bestimmen

Beim Zusammenführen von Items sollte man vorab mit "What links here" erfassen, welches der beiden Items mehr Links auf sich zieht und besser integriert ist. Dieses sollte das Ziel-Item werden, in dem die Information zusammenfließt; das erspart Arbeit bei den Link Korrekturen, die man im Abschließenden Arbeitsschritt durchführen sollte.

Das MergeItems Werkzeug

Das MergeItems Werkzeug des Menüs links führt zwei Items unter der Nummer des zweiten, des Ziel-Items, zusammen. Damit das problemlos geschieht, muss vor allem verhindert werden, dass Beschreibungen kollidieren.

Im ersten Arbeitsschritt sollte man die Kollisionen auflösen — eines der Items sollte durchweg leere Beschreibungsfelder haben. Auch sollte man beim zukünftigen Namen des Items vorplanen. Wenn man hier nichts unternimmt, dann gibt das Ziel-Item den Namen; der Namen des aufgelösten Items kommt, wenn er differiert, in die Alias Sektion.

Beim Merging kann es auch zu Blockaden kommen, wenn einander ausschließende Properties (namentlich Aussagen zur Folge zweier Items aufeinander) einander widersprechen.

Nach der Zusammenführung

Nach der Zusammenführung sollte man im Ziel-Item im ersten Arbeitsschritt die Aussagen überprüfen, die nun akkumuliert sind.

Im zweiten Schritt sollte man mit dem "What links here" Werkzeug erfassen, welche Items noch auf die aufgelöste Q-Nummer verlinken. Das ist zwar erst einmal unproblematisch, da ein "redirect" alle Verweise auf die Ziel-Nummer lenkt; in SPAQL Suchen werden jedoch diese Informationsdruchreichungen nicht durchgeführt; Hier erhält man Q-Nummern ausgegeben, auf denen nun keine Informations mehr liegt.

Die alten Links sollte man auflösen und durch die korrigierten ersetzen.