KI-Traffic und sinkende Nutzer: Wikipedia stellt neue Regeln auf

Künstliche Intelligenz und Wikipedia haben eine komplizierte Beziehung. Einerseits sind die riesigen Datenmengen der Online-Enzyklopädie eine wichtige Ressource für das Training von Sprachmodellen. Andererseits sorgt genau diese Nutzung nun bei der Betreiberstiftung für handfeste Probleme, die das Ökosystem von Wikipedia bedrohen. Die Wikimedia Foundation, die Organisation hinter dem Projekt, hat in einem Blog-Beitrag dargelegt, wie sie sich die Zukunft dieser Beziehung vorstellt.
Wie die Stiftung berichtet, sind die „menschlichen Seitenaufrufe“ im Jahresvergleich um 8 Prozent gesunken. Gleichzeitig verzeichnete man im Mai und Juni einen ungewöhnlich hohen Traffic, der die Server stark belastete. Nach einer Aktualisierung der Bot-Erkennungssysteme fand man dann auch schnell die Ursache: Ein Großteil dieses Traffics stammte von KI-Bots, die versuchten, ihre Herkunft zu verschleiern und die Inhalte im großen Stil abzugreifen – sogenanntes Scraping eben.
Als Reaktion darauf hat die Foundation nun Richtlinien für KI-Entwickler veröffentlicht. Man fordert einen „verantwortungsvollen“ Umgang mit den Inhalten:
- Quellenangaben und Attribution: KI-Systeme, die Wikipedia-Inhalte nutzen, sollen dies klar kenntlich machen. Plattformen sollen deutlich machen, woher die Informationen stammen.
- Nutzung der Enterprise-Plattform: Für die Nutzung von Inhalten im großen Maßstab, wie es beim Training von KI-Modellen üblich ist, verweist die Stiftung auf ihr bezahlpflichtiges Angebot „Wikimedia Enterprise“.
Bei Wikimedia Enterprise handelt es sich um ein Opt-in-Produkt, das speziell für Unternehmen konzipiert wurde, die Wikipedia-Inhalte im großen Umfang benötigen. Technisch stellt das dortige Angebot die Daten effizient und skalierbar bereit, ohne die Server der öffentlichen Webseite zu überlasten, wie es beim Scraping der Fall ist. Finanziell unterstützen die Einnahmen aus diesem Produkt direkt die gemeinnützige Mission der Organisation. Explizite rechtliche Schritte oder Strafen für das anhaltende Scraping wurden bislang nicht angedroht.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Gut so dieses linkslastige Konstrukt gehört sowieso bald der Vergangenheit an es lebe Grokipedia
Dann tauschen wir doch links mit rechts aus und wir haben das gleiche Problem, nur eben von der anderen Seite.
Stimmt, können wir ja dann vergleichen wenn Elon mit seinem Gronkwiki fertig ist. Ich meine er würde da so was basteln. Konkurrenz ist immer gut, am besten ohne politisch eingefärbten Einfluss, deswegen bin ich auch nicht mehr auf Wikipedia unterwegs.
Eben nicht! Das Netz wird wieder demokratischer, wenn Wikipedia seine Monopolstellung bzw. Gatekeeperfunktion verliert. Grokipedia wird Wikipedia ja nicht ersetzen, im besten Fall kommen noch weitere Player hinzu.
Es erinnert stark an den Kampf der Stummfilmdarsteller gegen den Tonfilm, auch damals wurde das als Katastrophe wahrgenommen. Ist allerdings nur der Lauf der Zeit und diese ist für Wikpedia nun vorbei, sie hat ihr Alleinstellungsmerkmal ein für alle mal eingebüßt.
was alles so auf diesem Blog durch geht…………..
Darauf erstmal ein Faschistengruß. Macht einem Grokipedia erst richtig schmackhaft.
@Dirk: jfi: Wenn du weiterhin aus jedem Scheiss einen politlastigen Kommentar machen möchtest, musst du das woanders tun.
Seitdem es die Grokipedia gibt sehe ich keinen Grund mehr, wieso es noch Wikipedia braucht.
Grokipedia ist in der Naturwissenschaft und Technik wirklich schlecht. Zum Glück gibt es da andere Quellen.
Noch! – Es handelt sich schließlich nur um eine frühe Beta Version v0.1
https://grokipedia.com/
Wikipedia ist zu einseitig. ChatGPT ist freier und weniger ideologisch, neue Mitbewerber wie Grokopedia graben ihr zusätzlich das Wasser ab, aber bringen endlich wieder mehr Diversity in die Landschaft der Enzyklopädien.
https://grokipedia.com/
R.I.P. rotots.txt
Die KI-Bots sind wesentlich aggresiver als die SearchEngine-Bots, die sich noch an den Gentleman’s Agreements gehalten haben.
Das Problem von Wikipedia ist nachvollziehbar: Nutzer fragen mittlerweile lieber eine KI, als noch klassisch auf Wikipedia danach zu suchen. Und für die KI ist natürlich Wikipedia einer der wichtigsten Stoffgeber.
Wikipedia hat dadurch Kosten, die von den KI-Anbietern nicht erstattet werden.
Das erinnert mich etwas an die GEMA-Gerichtsentscheidung heute in München…
Hilft nur noch, dass sich Wikipedia hinter einer Paywall versteckt. Also ich wäre bereit für eine Wikipedia-Mitgliedschaft zu zahlen.
„Nutzer fragen mittlerweile lieber eine KI, als noch klassisch auf Wikipedia danach zu suchen.“
Das hat man getan? Ich kam immer nur von google auf wikipedia
Selbst Google setzt inzwischen auf Gemini als KI, einfach mal in der Googlesuche ganz links auf KI-Modus klicken.
Für KIs ist Wikipedia nur eine Quelle, sie setzen auf Vielfalt, was das Ergebnis meistens besser und ausgewogener macht.
*robots.txt
die Bots haben auch hier schon die Kommentare übernommen…
die Wikipedia wird es weiterhin geben und wenn Firmen wie OpenAI nützliche Daten für ihre KI Modelle brauchen sollten Sie endlich beginnen für die Hardwarebeanspruchung der Wiki Geld zu zahlen. Wikipedia baut ja extra für diese Vektordatenbanken auf.
Auch hier sieht man, wozu KI führt: Sie greift kostenlos Wissen ab, dass von Menschen ins Netz gestellt wurde. Nur ist dieses Wissen nicht immer korrekt und und unbeeinflusst. Der Abgriff führt aber auch dazu, dass den Wissensplattformen die Nutzer wegbrechen. Wer versorgt die KI nun mit frischen Wissen? Begeben wir ins in eine Welt der Stagnation?
KI führt eher direkt nach Idiocracy. Wenn Modelle mit Müll trainiert werden UND zusätzlich noch halluzinieren kommt Müll im Quadrat dabei raus. Wenn dann noch KIs von diesen KIs lernen usw. potenziert sich das Ganze. Willkommen in der vollendeten Dummheit.
„Nur ist dieses Wissen nicht immer korrekt und und unbeeinflusst.“
Wie die Infos, die man von den Plattformen als User auch bekommt…
Das ist ein ganz normaler Wandel.
KI ist gekommen um zu bleiben.
Wenn die Nutzerzahlen von Wikipedia wegbrechen, dann müssen die sich etwas anderes überlegen um zu überleben.
Das Hauptproblem von Wikpedia ist ihr steinzeitliches „Friss oder stirb“-Prinzip. Man bekommt etwas vorgesetzt und muss damit zufrieden sein – oder eben nicht.
Bei KI kann ich konkret nachfragen und mein eigenes Wissen einbringen, so kommt ein Recherche-Dialog zustande, der wirklichen Mehrwert bringt und wieder Ausgangspunkt für neue Gedanken wird. Für den Selbstdenker ein ideales Tool, auch wenn es natürlich noch große Schwächen hat.
Wer sich mit einem Thema wirklich ernsthaft online auseinandersetzen will, kommt an KI nicht mehr vorbei, da kann Wikipedia machen was sie will.
Leider neigt KI wie chatGPT aber auch stark dazu es dem Nutzer recht machen zu wollen, anstatt ihm zu wiedersprechen wo es angemessen ist.
Faktische Fehler werden so nicht aufgedeckt sondern bestärkt.
Das ist für Selbstdenker eigentlich pures Gift weil es die Illusion von Richtigkeit vermittelt. Hoffe dass das in Zukunft irgendwie gelöst wird.
Aber das wollen die Leute doch spätestens seit es Facebook gibt: In Ihrer Blase bleiben und ständig die Bestätigung erhalten, dass sie die einzige Wahrheit kennen. Daher sind die KIs natürlich auch entsprechend parametrisiert und sagen ihrem User eben, dass er da was ganz richtig tolles sagt.
Was hier für Kommentare stehen. Merken die Blogbetreiber nicht, dass hier ganz gezielt Kampagne gefahren wird? Traurig…
So redet echt jede Seite, jedes Mal. Natürlich nur, wenn die eigene Meinung nicht widergespiegelt wird.
Ich finde die Antwort sehr bezeichnend. Ihr habt Euch offensichtlich ausgesucht, was für ein Publikum Ihr wollt. Das respektiere ich so, werde Euch jedoch nun aus meinem Feedreader entfernen.
Ich wiederum werde diesem Blog auch den Rücken kehren, weil Nutzer wie „Nichtraucher“ kommentieren. Da versuche ich mal Druck auszuüben und schon bekomme ich eine inhaltliche und reflektierte Antwort vor den Latz geknallt. Ein Skandal ist das!
Wo habe ich Druck ausgeübt oder eine „vor den Latz geknallt bekommen“?
Ich habe mir die Kommentare in diesem Blog über die letzten Monate angeguckt. Sie kommen aus einer Ecke des Internets, die ich sonst von X oder Telepolis kenne.
Damit möchte ich nichts zu tun haben, deshalb gehe ich.
Das ist genau die freie Meinungsäußerung und Medienwahl, die jeder Mensch haben sollte.
Aber Cancel Culture gibt es nur in der Phantasie, existiert in der Wirklichkeit gar nicht. Right?
Grad zufällig nochmal reingeguckt.
Wo das jetzt „Cancel Culture“ ist musst du mir erklären.
Ich sage „hier wird offensichtlich eine Kampagne gefahren.“ und „das Blog hat sich entschieden, welches Publikum es möchte, deshalb gehe ich.“. Bitte zeige mir anhand dieser Aussagen auf, wo ich jemanden aus der Öffentlichkeit drängen oder ihm seine Meinung verbieten möchte.
Ich möchte nur nicht Klicks und damit Werbeeinahmen ermöglichen, wenn mir das Publikum nicht gefällt.
Schreiben Sie wirklich bei jedem Medium, dessen Leser (!) Ihnen nicht gefallen, öffentlich in die Kommentare, dass Sie es nun meiden werden, um die Werbeeinnahmen zu reduzieren?
Irgendwie traurig…
Ich bin nun schon seit weit über 10 Jahren Leser dieses Blogs und muss Nichtraucher da beispringen. Solche Kommentare unter einem Artikel zu Wikipedia hätte es damals nicht gegeben, egal ob „Kampagne“ oder nicht. Die Kommentarkultur hier hat sich gerade in den letzten Jahren stark zum Negativen gewandelt. Dass eine solche Sorge nun von Caschy selbst mit einem platten Spruch abgebügelt wird, obwohl ihm ja die Tendenz bewusst sein muss, ist ziemlich enttäuschend. Ich kann mir das leider auch nur so wie Nichtraucher erklären, nämlich dass es genau so gewollt ist.
„Ich kann mir das leider auch nur so wie Nichtraucher erklären, nämlich dass es genau so gewollt ist.“ Das siehst du falsch. Solltest du nach +10 Jahren wissen, hoffe ich. Es ist wirklich immer so, wenn es um Politik oder so geht. Jeder hat immer etwas zu meckern, wie moderiert wird.
Und ich rechne es deinem Blog (sehr!) hoch an, dass nicht bei jeder Gelegenheit zensiert wird, weil sich einige Leute auf den Schlips getreten fühlen – oder “sich unwohl fühlen”.
Nichtraucher bietet das perfekte Anschauungsmaterial.
@kim: Man könnte das auch einfacher sehen. Das Image der Wikipedia hat in den letzten 10 Jahren einfach gelitten, ich war mal regelmäßiger Weihnachtsspender, das bin ich schon lange nicht mehr. Deshalb den Lesern eines Blogs eine Kampagne zu unterstellen, bzw. den Betreibern eines Techblogs vorzuwerfen, sie hätten die falschen Leser, ist doch hanebüchen.
und was ist mit den ganzen Bots die hier Werbung für das Projekt von Musk machen und wiederholt die URL posten? Das ist gewünscht?
Ich sehe in Bezug auf einen Blog auch keine rosige Zukunft, wenn er sich darauf beschränkt nur allgemeine Nachrichten wiederzugeben und Entwicklung nicht kritisch zu hinterfragen. Sonst schreibt den auch bald die KI komplett und nicht nur in Teilen.
Das ist gerade ein Vorteil des Blogs, hier wird nicht alles „eingeordnet“ wie beim ÖRR. Man bekommt die Informationen und kann sich selber seinen Reim darauf machen. Die Kommentare können auch ignoriert werden, wenn man die unterschiedlichen Meinungen nicht so mag.
Ja, leider. Sehe ich genauso. Die ersten Kommentare haben alle zufälligerweise direkt einen Link zu Grokipedia und sind absolut nicht differenziert. Werbung at its finest. Von Bots oder Anhängern.
Mal abgesehen davon, dass der Vorwurf einer „linkslastig ideologischen“ Wikipedia ja genau der Wortwahl der „ideologisch rechtslastigen“ Alternativen gegenübersteht. Mal abgesehen davon, dass es inzwischen bekannt sein sollte, dass gesunder Menschenverstand nicht mit links gleichzusetzen ist. Das ist genauso Kampagne, die nunmal funktioniert.
Ich glaube aber nicht, dass das ein Problem von Cachys Blog ist, sondern leider inzwischen im Internet bei öffentlichen Kommentarfunktionen usus ist. Die Blog-Beiträge sind nach wie vor vielseitig, objektiv oder mit klar erkennbarer persönlicher Meinung versehen. Deswegen bin ich gerne hier.
Das mit den Kommentaren ist schade, aber eine einfache Lösung ist schwer. Toleranz hat Grenzen, aber nicht unbedingt da, wo man selbst nicht der Meinung ist. Durch KI werden wir uns vermutlich noch schneller in einem ganz anderen Internet zurechtfinden müssen, als uns lieb ist.
Diese Richtlinien von Wikimedia halte ich für viel zielführender als die Klage der GEMA.
Denn KI ist erstmal wie ein „lernendes Kind“ sie braucht eine wissende Umwelt die sie „abgucken“ läßt. KI das herumspähen verbieten hieße einen elektronischen Kaspar Hauser erzeugen.
Hier eine ganz legale Plattform zum Lernen für die KI vorzuschlagen, deren Erlöse aber nicth an Plattenfirmen und Co., sondern an eine _gemeinnützige_!! organisation fließen – und das ganze ohne Drohungen und Strafrecht – das ist m. E. der bessere Weg.
Die Richtlinien werden kaum einen jucken, weil Wiki sich nicht gerichtlich durchsetzt.
Absolut verständliches Problem. Ich sehe da leider wirklich keine Lösung.
Ich kann die Wikipedia doch einfach via torrent runter laden und damit dann meine KI trainieren, oder? Das ist schon irgendwo fies da die Wikipedia Server zu belasten, finde ich. 😀
Guter Punkt, das habe ich mich auch gefragt. Es gab früher ja auch die Möglichkeit, einen Dump herunterzuladen.
Hoffentlich hält Wikipedia durch. So eine wertvolle Quelle von sorgfältig kuratiertem Wissen hatten wir in der Geschichte der Menscheit noch nie.
Ich nutze auch viel KI, aber gerade um sich bei Halluzinationen noch einmal abzusichern, bin ich immer noch treuer Nutzer. Stackoverflow leidet da leider viel mehr 🙁
die Dumps gibt es weiterhin, die Wikimedia bereitet ihre Daten sogar extra für KIs ind Vektordatenbanken auf. Gibt dazu einen interessanten Beitrag im DLF Podcast Computer und Kommunikation.
Die KI Branche ist zwar Milliarden schwer aber nicht bereit für Inhalte zu bezahlen….
Die Wikipedia sollte stolz darauf sein, dass sie an entscheidender Stelle mithilft, ihre KI-Nachfolger auf das Gleis zu setzen. Der Bedeutungsschwund bei veralteter Technik ist normal, kein Grund zum Jammern. Wikipedia wird weiter bestehen, allerdings wird sie nicht mehr „das Lexikon“ der Welt sein.