Nvidia soll fürs KI-Training Videos von Netflix und YouTube ohne Zustimmung genutzt haben
Künstliche Intelligenz wird in der Tech-Industrie allerorts in den Mund genommen, um Hype zu generieren. Selbst einfachste Algorithmen bewirbt man inzwischen mit dem Label „KI“. Denkt man an Unternehmen, die von dem ganzen Rummel am stärksten profitiert haben, kommt man schnell auf Nvidia. Letztere liefern nämlich an so gut wie alle Anbieter die passenden Chips. Doch jetzt heißt es, im Hintergrund habe Team Green nicht ganz koscher gearbeitet. Um nämlich wiederum seine eigenen KI-Modelle zu trainieren, soll Nvidia massenhaft Scraping betrieben haben.
Unter anderem habe Nvidia dafür auch urheberrechtlich geschützte Inhalte verwendet. Demnach habe Nvidia Mitarbeiter damit beauftragt, z. B. Videos von Netflix und YouTube herunterzuladen. Verwendet hat man das geschützte Material dann für kommerzielle KI-Projekte. Beispielsweise soll Nvidia mit den Daten seine Omniverse-Projekte, die Arbeit an selbstfahrenden Technologien und auch seine „digitalen Menschen“ der Reihe ACE vorangetrieben haben.
Gegenüber Engadget hat man sich damit verteidigt, dass man sich nach eigener Ansicht an das Urheberrecht halte. Man argumentiert ähnlich wie Suno und vergleicht das massenweise Einsammeln und Auswerten von Daten durch Software mit menschlichen Lernprozessen und kreativer Inspiration. Sprecher YouTubes haben bereits anders argumentiert und betont, dass das Scraping auf der Plattform untersagt sei.
Nvidia soll interne Bedenken weggewischt haben
Mitarbeiter, die intern rechtliche oder moralische Bedenken angemeldet hatten, soll man zurechtgewiesen haben. Dabei soll Nvidia auch freimütig interne Datenbanken mit Videomaterial aus Games, die Trailer-Datenbank MovieNet und mehr beansprucht haben. Einige herangezogenen Daten sollen nur für die Forschung, nicht aber für die kommerzielle Verwendung freigegeben worden sein – etwa Material von HD-VG-130M, das über 130 Mio. YouTube-Videos gesammelt hat. Das habe Nvidia aber nicht weiter zum Zögern gebracht.
Um beispielsweise nicht von YouTube beim Scraping ertappt zu werden, soll Nvidia Virtual Machines (VMs) mit wechselnden IP-Adressen verwendet haben. Der Bericht mit einer ausführlichen Beschreibung dieser Praktiken ist bei 404Media zu finden. Offenbar konnte man die Informationen über zugespielte E-Mails, interne Slack-Absprachen und weitere Dokumente direkt von Nvidia nachvollziehen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Eventuelle Entschädigungen wird NVIDIA wohl schon mit eingepreist haben.
Ich kann auch schon die Konsequenzen voraussagen: nix, bzw. nix schmerzhaftes für Nvidia. Man muss einfach dreist genug sein, bzw. das Verbrechen so umfassend, dass der Gesetzgeber es nicht greifen kann. Schwupps, vergessen. Oder es dauert Jahrzehnte (wie jetzt bei Google) bis zu einem Schuldspruch – und jeglicher Schaden kann nicht mehr gut gemacht werden.
Aber wehe, ich habe einen Zahlendreher bei meiner Steuererklärung – da ist man direkt mit einem Bein im Gefängnis. Eigentlich bin ich ja nicht so einer von „den da oben“ Menschen, aber umso älter ich werde, umso mehr steigt der Anreiz dazu.
Tja, die zentralen Fragen sind a) ist das überhaupt illegal? und b) dürfte YouTube angesichts der Marktmacht das überhaupt untersagen? Wenn YouTube jetzt nur von Alphabet-KI genutzt werden darf/kann, haben die vermutlich noch größere Probleme mit den Kartellbehörden als jetzt schon…
Da ja wohl auch Tech-YouTube-Kanäle abgeschöpft wurden und auch auf Nachfrage kein Problem erkannt wird, ist hoffentlich die Konsequenz, daß diese (und andere potentielle Opfer vom AI-Wildwest) keine Nvidia-Produkte mehr testen oder erwähnen – und nicht nur für ein paar Monate, für unbestimmte Zeit.
Wäre gut, vielleicht fallen dadurch die Preise.
Es wird natürlich nicht passieren.
Wie kamen die überhaupt an die Videos von Netflix, ohne das DRM umgangen zu haben?
Und warum hat nVidia dann die Software, die sie dafür vermutlich genutzt haben, nicht gleich bei Github veröffentlicht?
> Sprecher YouTubes haben bereits anders argumentiert und betont, dass das Scraping auf der Plattform untersagt sei.
Witzig, wie ein Unternehmen (Google), für das das Scraping von fremden Inhalten die Grundlage des Geschäftsmodells war und immer noch ist, das Scraping den anderen verbieten will.