ChatGPT: Advanced Voice Mode startet auch in Europa
Ihr erinnert euch an die Geschichte mit dem von OpenAI benannten Advanced Voice Mode von ChatGPT? Im Rahmen von GPT4o hatte man eine neue Stimme vorgestellt, die natürlicher klingen und dem Nutzer den Eindruck vermitteln sollte, mit einem Menschen zu sprechen.
Jener „Fortgeschrittene Sprache“-Modus innerhalb der App nutzt die nativen Audiofähigkeiten von GPT-4o und ermöglicht natürlichere, Echtzeit-Gespräche, die nonverbale Hinweise wie die Sprechgeschwindigkeit erfassen und emotional reagieren können. Die Stimme „Sky“ klang jedoch stark nach Scarlett Johansson, woraufhin die Schauspielerin gerichtliche Schritte einleitete.
Es gab einiges an Hin und Her, sodass erst Ende Juli der Advanced Voice Mode von ChatGPT in erste Märkte kam. Die EU, Schweiz, Liechtenstein, Island und Norwegen waren aber außen vor. Das ändert sich nun, denn OpenAI hat auch in diesen Märkten den Advanced Voice Mode für Plus-Nutzer zur Nutzung freigegeben. Die entsprechende Hilfeseite ist noch nicht angepasst.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Entweder kommt es mir nur so vor oder seit dem „Advanced Voice Model“ darf man nichts mehr dazwischen sagen obwohl es nur ein räuspern oder so ist. Denn das gute Voice Model bricht sofort das reden ab und interpretiert was man gesagt haben soll.
Naja, das ist der Sinn dahinter. Hintergrundgeräusche werden üblicherweise nicht interpretiert, aber alles was du sagst oder Laute, die du von dir gibst, lassen das Modell wissen, dass du etwas sagen willst.
Also ich konnte Hintergrundgeruschauswertung schon vor dem Update in den Settings ein- oder ausschalten. Und dass sie die alten Stimmen nun auch verändert haben ohne die Option auf OptOut is mies.
Mit den Stimmen im eigenen Dialekt sprechen und sie antworten lassen. Was für eine Gaudi 😉
Aber dafür neue AKs in Betrieb nehmen…
Bei mir hakeln die Stimmer leider immer wieder, das macht es weniger natürlich
ich habe die Stimmen gerade ausprobiert. Die haben alle einen englischen oder holländischen Zungenschlag! Bei „dir“ und „für“ besonders deutlich. Warum das denn? (nicht in der Vorschau übrigens sondern in der Anwendung!)
Sag der KI doch einfach dass sie mehr auf die Aussprache achten soll. Ist doch ganz einfach ¯\_(ツ)_/¯
Weil die Hauptsprache immernoch englisch ist und sie die Aussprache in anderen Sprachen noch nicht perfekt gelöst haben.
Gefühlt habe ich die Plus-Features auch immer ohne Plus. So jetzt auch hier.