Adobe VoCo: Sprachaufnahmen inhaltlich ändern – so simpel wie mit Texten

adobe logWenn das mal nicht noch irgendwann einmal zu Kontroversen führt… Adobe hat auf seiner alljährlichen MAX-Conference in San Diego ein neues Projekt mit dem Namen VoCo vorgestellt, das es einfacher denn je machen soll, aufgenommene Sprachsamples nachträglich abzuändern und nötigenfalls einen komplett anderen Kontext zu erzeugen. Was es dazu braucht, sind lediglich 20 Minuten Sprachmaterial einer einzelnen Person, welche vom Tool analysiert, transkribiert und anschließend in ein Stimmenmodell umgewandelt werden. So sei es anfangs zwar noch möglich herauszuhören, wenn ein Wort nachträglich abgeändert wurde, das könnte sich aber mit der Zeit ändern.

adobe-voco_1

Denn das Tool verfeinere seine Techniken über die Zeit immer weiter. Man kann sich das in etwa so vorstellen:

Eine Audioaufnahme einer Person beinhaltet beispielsweise den Satz „Und dann habe ich für fünfzig Euro bestes Rindfleisch bekommen!“. Dieser Satz existiert neben der Tonspur auch als Text im Tool, welcher nun direkt wie in Word, etc geändert werden kann. Machen wir aus dem Satz nun „Und dann hat er einfach drei Wochen Kater nach dem Abend.“ und speichern diesen so, bekommt die komplette Sprachaufnahme einen völlig anderen Kontext. Wenn VoCo das Sprachmodell erst einmal „perfekt“ beherrscht, soll man angeblich keine künstlichen Eingriffe mehr erkennen können. Vielleicht ist es ganz gut, dass VoCo während der aktuellen Präsidentschafts-Qual in Vereinigten Staaten noch nicht finalisiert ist.

adobe-voco_2

Adobe selbst spricht auch nicht davon, das Tool als eigenständiges Produkt vermarkten zu wollen. Vielmehr sei zu erwarten, dass dieses in andere Produkten des Unternehmens implementiert werden könnte. Interessant ist es auf jeden Fall.

(via TechCrunch)

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Nordlicht, Ehemann und Vater. Technik-verliebt und lebt fürs Bloggen. Außerdem: Mail: benjamin@caschys.blog / Mastodon

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

4 Kommentare

  1. Dokumenten und Fotos darf man ja schon lange nicht trauen. Jetzt auch noch Tonaufnahmen. Prost Mahlzeit!

  2. Uiuiui, das ist keine gute Entwicklung finde ich. Das gibt nur Ärger und Manipulationsvorwürfe 🙁 Sätze werden ja eh schon oftmals aus dem Kontext gezogen und woanders zu verwendet und dann sowas hier. Puh…

  3. Dann sollte es ja rein theoretisch ne perfekte Sprachausgabe bei den Assistenten geben. Dann muss zB Frau Google nur noch die 20 Min was lesen und daraus entsteht ne natürliche Stimme und nicht so wie die Sprachausgabe momentan noch zu synthetisch klingt.

  4. @Hotti
    Tonaufnahmen kann man nicht trauen seitdem es Tonaufnahmen gibt. Wenn’s um die Wurst geht gibt es heutzutage viel bessere Methoden um herauszufinden ob eine Aufnahme verändert wurde.

    http://www.bbc.com/news/science-environment-20629671

    Methode bei der minimale Schwankungen der Frequenz des Stromnetzes aufgezeichnet werden, die Schwankungen schlagen sich in Form von nicht hörbarem Brummen in Audioaufnahmen wieder die in der Nähe des Stromnetzes (Masten, Leitungen, Steckdosen, etc) aufgezeichnet wurden.
    Schwankungen des europ. Netzes kann man zBsp hier in Echtzeit sehen: http://www.mainsfrequency.com

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.