WordPress- und Tumblr-Inhalte werden zu KI-Schulungen genutzt
Es gibt Berichte, dass Tumblr und WordPress kurz davor sind, Vereinbarungen zum Verkauf von Nutzerdaten an die KI-Unternehmen OpenAI und Midjourney zu treffen. Laut 404 Media steht die Muttergesellschaft Automattic kurz vor dem Abschluss eines Abkommens, um Daten zur Verfügung zu stellen, die die Modelle der KI-Unternehmen trainieren sollen.
Es ist noch nicht klar, welche Daten genau im Rahmen dieser Vereinbarung einbezogen werden, allerdings gibt es Gerüchte, dass Automattic möglicherweise zunächst zu weit gegangen ist. Ein angeblich interner Post des Tumblr-Produktmanagers Cyle Gage legt nahe, dass Automattic ursprünglich vorbereitet war, private oder partnerbezogene Daten zu senden, die eigentlich nicht in das Abkommen einfließen sollten.
Zum kritisch betrachteten Inhalt gehörten unter anderem private Beiträge auf öffentlichen Blogposts, gelöschte oder suspendierte Blogs, unbeantwortete (und daher nicht öffentlich gepostete) Fragen, private Antworten, als explizit markierte Beiträge und Inhalte von Premium-Partner-Blogs. Auf Nachfrage antwortete Automattic, dass man nur öffentliche Posts nutzen wolle, die kein Opt-out genutzt haben.
Weiteren Berichten zufolge Automattic am heutigen Mittwoch die Einführung eines neuen Opt-out-Tools, das es Benutzern angeblich ermöglichen soll, Dritte – einschließlich KI-Unternehmen – daran zu hindern, die Daten zu Trainingszwecken zu verwenden. Wichtig zu wissen: Es handelt sich bei WordPress nicht um das von Nutzern selbst gehostete, sondern um den Service wordpress.com.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Wenn die Daten anonymisiert sind, habe ich kein Problem damit. Wir werden alle enorm von K.I. profitieren. Dass zu Trainingszwecken unsere (unpersönlichen) Daten genutzt werden, ist ein kleiner persönlicher Beitrag ans Kollektiv – also fast ein wenig wie Steuern zahlen.
Und nein, dieser Text enthält keine Ironie.
Naja, wenn die Daten vollkommen anonymisiert sind, dann hat niemand ein Problem damit. Das gibt es halt nicht. Jeder Sprach- und Schreibstil ist in vielerlei Dimension distinkt. Ein vollkommen anonymer Text, der sich sicher nicht mehr auf andere, identifizierte öffentliche Texte zurückführen lässt ist vermutlich einfach nur noch das Alphabet oder so. ..und damit für KI Trainings vollkommen nutzlos.
Besitze deine Inhalte. Alles auf Social Media hochgeladen, nur noch bei Reddit diskutiert, den Blog nicht selbst gehostet und jetzt wird alles verkauft, was man kreativ getan hat und vermarktet, ohne echten Einfluss. Blockierung hin oder her.
Eine KI, gespeist aus den Inhalten von tumblr, stelle ich mir seltsam vor. Wem soll sie nutzen? Es sind häufig Meinungsposts, ironische Kommentare oder einfach nur witziger Unfug.
Gibt es bei Tumblr nicht hauptsächlich Erotik? Viel Spaß beim Lernen!
Wie lernt ein Kind? Durch Nachahmen, eigene Erfahrung, also meist Versuch und Irrtum bzw. aufstehen und hinfallen , und hoffentlich durch ein gutes soziales Umfeld, also Familie, KiTa und Schule mit verantwortungsvollen PädagogInnen. KI sollte genauso sorgfältig „an die Hand“ genommen werden und nicht einfach mit automatisiert eingesammeltem Wissen überschüttet werden nach dem Motto „Nürnberger Trichter“. Es braucht vor allem „Lehrkräfte“ für KI. Diese sollten dann die Inhalte aussuchen und als eine Art Redaktion vorfiltern. Damit würde vielleicht verhindert daß KI all den Mist der von sog. „Influenzern“ oder selbsternannten „Journalisten“ in irgendwelche Foren oder auf Plattformen eingestellt wird, als „Weltwissen“ übernimmt. Guter Content, egal ob Buch oder Video steht und fällt mit dem „Mehraugenprinzip“also lektorat und Redaktion. Jeder der „sich selbst broadcastet“ (youtube-Motto) ist höchstens ein amüsanter Selbstdarsteller aber kein wie auch immer gearteter Journalist oder Autor. sowas solte KI nicht als Lerninhalt bekommen.