Wikidata: Zentrale Datenbank für alle Wikipedien ab sofort verfügbar
Habt ihr schon einmal von Wikidata gehört? Dies ist ein Projekt von Wikimedia Deutschland, welches das Ziel hat eine zentrale Datenbank für strukturierte Daten in den vielen Artikeln der Wikipedien zu liefern. Bisher gab es das Problem, dass beispielsweise Änderungen eines Artikels immer in jeder einzelnen Sprache eingepflegt werden mussten, wodurch diese auch einen unterschiedlich aktuellen Datenbestand hatten.
Dies soll sich mit Wikidata ändern, denn ab sofort müssen in den jeweiligen Artikeln nur noch Variablen gesetzt werden, die an einer einzigen Stelle gepflegt werden.
Von der Arbeit profitieren allerdings nicht nur die Leser und Bearbeiter bei Wikipedia. Man hat sich wie üblich für eine freie Lizenz der Daten entschieden, in diesem Fall die Creative Commons Public Domain CC0 1.0. Dadurch können Programmierer über eine extra angebotene API die Daten in ihren Programmen ebenfalls nutzen. Dies dürfte auch einer der Gründe für Google gewesen sein, die das Projekt finanziell unterstützen und die Daten bei sich in der Google Suche anzeigen.
[werbung] Aktuell befindet man sich in Phase 2, in der die Daten für die Infoboxen gezogen werden, wobei man hier auf die Mitarbeit der einzelnen User angewiesen ist, die die statischen Informationen durch die neuen Variablen austauschen müssen. Ein anschauliches Beispiel, wie diese strukturierten Daten aussehen, zeigt dieser Datensatz zu Russland. Inzwischen hat man 12 Millionen Datensätze angelegt, dennoch ist noch einiges zu tun. Im nächsten Schritt will man die Unterstützung für das Darstellen automatisch erstellter Listen und Zusammenfassungen in Artikeln der Wikipedia hinzufügen.
Sobald die Arbeiten abgeschlossen sind, wird das Projekt an die Wikimedia Foundation abgegeben und von dort aus zentral weiterentwickelt. Ich denke Wikidata hilft den freiwilligen Mitarbeitern etliche stupide Arbeit abzunehmen und damit die gesunkene Motivation eventuell wieder etwas zu steigern. Aber gerade durch die offenen Lizenzen kann es später jedem Einzelnen helfen, die Daten in seinen Projekten einzubinden und sich einiges an Pflegearbeit zu ersparen. [via, Quelle]
Warum bloß das Rad immer wieder neu erfunden werden muss…
Freebase finde ich dafür deutlich schöner – und es hat schon weitaus mehr Datensätze. unübersichtlich viele, das der einzige Kritikpunkt.
@JSG Warum? Ganz einfach, weil sich in der Breite kein Schwein für Freebase interessiert. Ideen gibt es wir Sand am Mehr, die soziale Dynamik und Motivation der Einzelnen ist der Schlüssel, egal ob nun ehrenamtlich, marktwirtschaftlich oder staatlich organisiert.