OpenAI: Klonen einer Stimme mittels 15-Sekunden-Clip
Mittlerweile sind mit KI viele Dinge möglich. Deepfakes in Form von Bild und Video, komplexe Berechnungen, Hilfestellungen und selbst das Generieren von Musik. Auch das Klonen von Stimmen ist grundsätzlich nicht neu, doch wenn ein Unternehmen wie OpenAI darüber berichtet, muss man vielleicht genauer hinschauen. Zwei Jahre hat man an Voice Engine gearbeitet, die aber derzeit nur für eine Handvoll Leute verfügbar ist.
Zuerst in ChatGPT Voice und anderen Anwendungen genutzt (vermutlich kennt ihr heygen), zielt OpenAI auf eine vorsichtige, verantwortungsvolle Einführung aufgrund von Missbrauchsrisiken ab. Frühe Anwendungen umfassen Bildungsassistenz, Inhaltsübersetzung, Verbesserung der Dienstleistungserbringung, Unterstützung für nicht-sprechende Personen und Stimmerholung.
OpenAI betont Sicherheitsmaßnahmen wie Wasserzeichen und eine No-Go-Stimmenliste zur Verhinderung von Identitätsmissbrauch und hebt die Notwendigkeit einer verantwortungsvollen Einführung von synthetischer Sprachtechnologie und gesellschaftlicher Widerstandsfähigkeit gegen potenziellen Missbrauch hervor.
Die neue Technologie kann aus einem 15-Sekunden-Audio-Clip einer Person eine künstlich erzeugte Stimme erstellen. Diese von der KI erzeugte Stimme ist in der Lage, Text entweder in der Sprache des ursprünglichen Sprechers oder in vielen anderen Sprachen vorzulesen. Wer sich ein paar Demo-Stimmen anhören möchte, der kann dies in der Ankündigung von OpenAI tun.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Soweit mir bekannt wird die Technik bereits von Kriminellen für Telefonbetrug ausgenutzt. Die Eltern einer Bekannten wurden bereits von ihrer anderen „Tochter“ angerufen und um Geld gebeten. Die Stimme soll am Telefon echt geklungen haben. Persönlich finde ich die Technik zwar interessant, sehe aber keine wirklich sinnvolle Verwendung außer Täuschung.
Hallo Krümelmonster, „sehe aber keine wirklich sinnvolle Verwendung außer Täuschung.“ Beispiele wurden im Text doch genannt : menschen die ihre Stimme zu verlieren drohen, können ein „Stimm-Backup“ erstellen. Schonung der Stimme z. B. beim Aufsprechen langer Texte … und auch im künstlerischen Bereich : eine Aufnahme z. B. von kaiser Wilhelm von Tonwalze abgenommen und entsprechend aufbereitet: Und im nächsten Historienfilm spricht der kaiser eben mit Originalstimme z. B. ansprachen die nicht als Original-Tondokument überliefert sind. Dann noch sein Abbild in 3-D-Motion per KI und zumindest Filme die Epochen zur Grundlage haben aus denen Bilder und oder Töne überliefert sind können Szenen aus vergangener zeit wieder zum Leben erwecken. Klar keine „Massenanwendung“ aber das alles hat nichts mit Betrug zu tun und ist eine Erweiterung vorhandener Möglichkeiten.
Letztendlich wird man so eine Technik nicht aufhalten können, auch wenn die nützlichen und legitimen Anwendungen sich in Grenzen halten und gleichzeitig das Missbrauchs-Potential enorm ist. Jeder, dessen Stimme z. B. auf YouTube zu hören ist, könnte demnach problemlos imitiert werden. Bin gespannt, wohin das in den kommenden Jahren führen wird.
Da stimmt, aber wieviele Leute wurden durch Messer verletzt, getötet? Wieviele Menschen seitens Sprengstoff usw.? Klar missbräulich sind meist die Dinge, bei dem einen die Erfahrung/Fantasie im Stich lässt oder mitunter recht einseitig geprägt ist.
Der Vergleich hinkt, weil alles das lediglich regional begrenzte Aktionen sind und nur mit hohem Aufwand und viel krimineller und teils gewalttätiger Energie umzusetzen. Das „moderne“ Unrecht via Internet setzt dagegen meistens „nur“ auf Betrug und auf Masse, ist leicht durchzuführen und erfordert nur selten eine direkte Auseinandersetzung mit dem Opfer. Daher ist es viel leichter, das eigene Unrechtsbewusstsein klein zu halten und anderen Menschen zum eigenen Vorteil zu schaden.
Wo entwickeln wir uns nur hin…
Wie kann man sich in die No-Go-Liste eintragen?
Auch wenn es noch nicht für jedermann verfügbar ist: Ich bin gespannt, wie lange es dauert, bis zum ersten mal jemand verurteilt wird, weil er angeblich etwas gesagt hat. Türkische Callcenter, die es heute schon schaffen, aus der Türkei mit deutscher Nummer anzurufen, werden sich zudem einen Dreck darum scheren, was hier verboten ist. Fremden Telefonnummern antworte ich heute schon nur mit Hallo. Künftig werde ich also überhaupt keine Fragen mehr beantworten
… oder Callcenter aus Zypern, dem Kosovo, Griechenland, Portugal usw. Zürkei gibt es die wenigsten und oft genug findet man Deutsche dabei die im Ausland ihr Unwesen treiben, denn aus dem eigenen Land heraus müßte man schon recht blöde sein.
VoIP vor 10 Jahren, beliebige Absendernummer eintragbar, schon ruft man mit der Nummer von ner Versicherung an. Blabla Gespräch für 2 Minuten, alles wird aufgezeichnet und im Nebenraum „nachbearbeitet“.
Deutsches Unternehmen in Deutschland übrigens, was Kohle von fetten deutschen Unternehmen bekommt.
Das alles nur im Ausland passiert wird einem durch die geschmierte Presse vermittelt, die Zahlungen für Werbeanzeigen als Gegenleistung bekommen.
Von der Regierung aber leider auch so gewollt. Es wäre eine Leichtigkeit dem einen Riegel vorzuschieben. Jeder (angebliche) Telefonabschluss könnte schriftlich vom Unternehmen bestätigt werden müssen und dem müsste man selbst schriftlich das OK geben, nur dann wäre es ein Vertrag.
Das ist aber nicht gewünscht…. dreimal darf man raten, wieso (einfach mal schauen wo die zuständigen Politiker in den Aufsichtsräten sitzen) 😉
Ich gehe prinzipiell schon immer nur mit Hallo ran bei unterdrückten oder mir unbekannten Nummern und manchmal muss ich fragen ob die anrufenden wissen mit wem sie sprechen…
ausländische Callcenter und Anrufe aus dem Ausland. Es wird wieder ein Eindruck erweckt..
.. Danke
Hallo mypat, auch wenn ich kein Anhänger pauschaler Vorverurteilungen nach dem Motto „Alle xxx machen yyy“ bin – sog. Anrufe von Microsoft, Zahlungsdienstleistern usw. mit Nummern die mit „00“ oder anderen kryptischen Zeichenfolgen beginnen sind weder neu noch ein Vorurteil. Sie sind Tatsache in der anrufliste.
Dass das so ist bezweifelt keiner. Was hier angekreidet wird, ist das Framing, dass in erster Linie Ausländer das machen. Als wenn Deutsche (z. B. Wirecard) oder andere Weiße (Sam Bankman-Fried, FTX) nicht auch massiv Betrug begehen, sogar im Milliardenbereich. Man hätte ja auch pauschal sagen können, dass das Betrügern neue Türen öffnet.
Natürlich werden diese nur aus dem Ausland kommen, weil die Verfolgung nicht derart ideal in gewissen Ländern ist. Aber, es hindert ja keinen Deutschen daran seine Machenschaften über das Ausland einzufädeln. Ist ja viel sicherer, in der heutigen Zeit muss man nicht einmal dort wohnen.
Robert Redford in dem Film Sneakers die Lautlosen. Meine Stimme ist mein Passwort.
Schöne neue Welt
Diese Technologie und deren Möglichkeiten wurde bereits bei James Bond in „Diamentenfieber“ dargestellt. Das war vor 53 Jahren! Jetzt ist es Realität. Krass!