KI-Trainingsdaten: Apple zahlt 25 bis 50 Mio. US-Dollar an Shutterstock

Apple hat an Shutterstock offenbar zwischen 25 und 50 Mio. US-Dollar gezahlt, um sich KI-Trainingsdaten zu sichern. Somit erhält man von der Foto-Plattform eine umfangreiche Bilddatenbank für das Training seiner Modelle. Zuvor hatten auch schon Amazon, Google und Meta Abkommen mit Shutterstock abgeschlossen.

Es zeigt sich, dass umfangreiche Foto-, Video- und Musikdatenbanken immer wertvoller werden, denn sie werden für das KI-Training dringend benötigt. Offenbar zahlen Unternehmen derzeit im Durchschnitt 1 bis 2 US-Dollar pro Bild, 2 bis 4 US-Dollar für kurze Videos und sogar 100 bis 300 US-Dollar pro Stunde für längere Filme. Was Text betrifft, so seien laut einem Bericht von Reuters 0,001 Cent pro Wort üblich.

KI-Anbieter haben mutmaßlich in der Vergangenheit auch urheberrechtlich geschütztes Material für das Training ihrer Modelle genutzt und sich damit viel Kritik zugezogen. Entsprechend sucht man jetzt nach anderen Wegen und das umfasst Deals mit Plattformen, die über große Content-Bibliotheken verfügen. Auch der Fundus von sozialen Netzwerken ist begehrt, weswegen sich Google beispielsweise mit Reddit geeinigt hat.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hauptberuflich hilfsbereiter Technik-, Games- und Serien-Geek. Nebenbei Doc in Medienpädagogik und Möchtegern-Schriftsteller. Hofft heimlich eines Tages als Ghostbuster sein Geld zu verdienen oder zumindest das erste Proton Pack der Welt zu testen. Mit geheimniskrämerischem Konto auch bei Facebook zu finden.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

4 Kommentare

  1. Interessant wäre noch ob die Urheber der Bilder einen Anteil von den bis zu 50 Mio. sehen. Immerhin kauft man ja regulär die Bilder bei Shutterstock. Ob jetzt einzeln oder in Masse sollte ja das gleiche sein.

    • Wie immer – eher nicht. Bin mal gespannt was die KI so kreieren soll, wenn niemand mehr schreibt, malt oder etwas erschafft, weil alles eine KI kann und woher die KI dann lernt. Von sich selber? Zu halluzinieren? Echt gruselige Aussichten, wenn ihr mich fragt. Auch sozial und gesellschaftlich. Aber das dauert ja noch ein Weilchen, ehe es soweit ist.

  2. Es dürfte ja genügen öffentlich zugänglichen Content geben. Z. B. kann man die KI einfach öffentlich zugängliche Fernsehprogramme schauen oder Radio hören lassen … oder wie bei StreetView fahren Wagen durch die Gegend die Straßenszenen filmen, aber nicht um daraus Ansichten für einen Kartendienst zu generieren sondern die KI einfach mit Weltwissen zu versorgen. Anders lernt ein Mensch doch auch nicht – viele Menschen unterstüzten zumindest das Erlernen einer Fremdsprache genau dadurch: lesen von Zeitungen und hören und schauen von medien in der jeweiligen Fremdsprache. Kann sogar zeitgemäßer sein als ein gut abgehangenes Lehrbuch da man so Alltagssprache hört. Ein Kind das lernt und dabei „mit den Augen stiehlt“. muß ja auch nicht fürs „Abgucken“ und „Nachahmen“ zahlen. Die Welt ist gemeinfrei. Was öffentlich sicht- und hörbar ist sollte allen – auch KI-Modellen – frei zugänglich sein. Immerhin fäll der Nutzen dieser Modelle irgendwann an die Gesellschaft zurück – genau wie wir alle von Kindern profitieren die viel gehört, gesehen und erfahren konnten ohne daß sie dafür irgendwo Mitglied sein mußten oder gar zahlen sollten. Eine kranke Welt in der sogar das Foto einer ganz normalen Blume monetarisiert werden soll.

    • Öffentlich zugängliche Fernsehprogramme oder Radio ist natürlich ein No-Go. Denn die darfst du natürlich nicht gewerblich nutzen. In Deutschland steigen dir aber ganz schnell die Gema und die VG Wort und Bild aufs Dach wenn du das tust. Von daher auch nichts für die KI. Also wenn man KI-Modelle trainieren will, dann muss man entweder selbst Trainingsdaten schaffen, auf free-to-use Daten zugreifen oder welche bezahlen. Recht einfach.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.