Wikidata: Zentrale Datenbank für alle Wikipedien ab sofort verfügbar

Habt ihr schon einmal von Wikidata gehört? Dies ist ein Projekt von Wikimedia Deutschland, welches das Ziel hat eine zentrale Datenbank für strukturierte Daten in den vielen Artikeln der Wikipedien zu liefern. Bisher gab es das Problem, dass beispielsweise Änderungen eines Artikels immer in jeder einzelnen Sprache eingepflegt werden mussten, wodurch diese auch einen unterschiedlich aktuellen Datenbestand hatten.

Dies soll sich mit Wikidata ändern, denn ab sofort müssen in den jeweiligen Artikeln nur noch Variablen gesetzt werden, die an einer einzigen Stelle gepflegt werden.
Wikidata
Von der Arbeit profitieren allerdings nicht nur die Leser und Bearbeiter bei Wikipedia. Man hat sich wie üblich für eine freie Lizenz der Daten entschieden, in diesem Fall die Creative Commons Public Domain CC0 1.0. Dadurch können Programmierer über eine extra angebotene API die Daten in ihren Programmen ebenfalls nutzen. Dies dürfte auch einer der Gründe für Google gewesen sein, die das Projekt finanziell unterstützen und die Daten bei sich in der Google Suche anzeigen.

[werbung] Aktuell befindet man sich in Phase 2, in der die Daten für die Infoboxen gezogen werden, wobei man hier auf die Mitarbeit der einzelnen User angewiesen ist, die die statischen Informationen durch die neuen Variablen austauschen müssen. Ein anschauliches Beispiel, wie diese strukturierten Daten aussehen, zeigt dieser Datensatz zu Russland. Inzwischen hat man 12 Millionen Datensätze angelegt, dennoch ist noch einiges zu tun. Im nächsten Schritt will man die Unterstützung für das Darstellen automatisch erstellter Listen und Zusammenfassungen in Artikeln der Wikipedia hinzufügen.

Sobald die Arbeiten abgeschlossen sind, wird das Projekt an die Wikimedia Foundation abgegeben und von dort aus zentral weiterentwickelt. Ich denke Wikidata hilft den freiwilligen Mitarbeitern etliche stupide Arbeit abzunehmen und damit die gesunkene Motivation eventuell wieder etwas zu steigern. Aber gerade durch die offenen Lizenzen kann es später jedem Einzelnen helfen, die Daten in seinen Projekten einzubinden und sich einiges an Pflegearbeit zu ersparen. [via, Quelle]

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Der Gastautor ist ein toller Autor. Denn er ist das Alter Ego derjenigen, die hier ab und zu für frischen Wind sorgen. Unregelmäßig, oftmals nur 1x. Der Gastautor eben.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

2 Kommentare

  1. Warum bloß das Rad immer wieder neu erfunden werden muss…

    Freebase finde ich dafür deutlich schöner – und es hat schon weitaus mehr Datensätze. unübersichtlich viele, das der einzige Kritikpunkt.

  2. @JSG Warum? Ganz einfach, weil sich in der Breite kein Schwein für Freebase interessiert. Ideen gibt es wir Sand am Mehr, die soziale Dynamik und Motivation der Einzelnen ist der Schlüssel, egal ob nun ehrenamtlich, marktwirtschaftlich oder staatlich organisiert.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.