Amazon Nova Sonic: Neues KI-Sprachmodell verspricht natürlichere Dialoge

Amazon hat mit Nova Sonic ein neues Sprachmodell vorgestellt, das die Art und Weise, wie Nutzer mit KI-Systemen kommunizieren, grundlegend verändern soll. Der Clou dabei: Anders als bei bisherigen Lösungen müssen Entwickler nicht mehr mehrere verschiedene Modelle für Spracherkennung, Textverarbeitung und Sprachausgabe kombinieren.
Das neue Modell vereint alle notwendigen Funktionen in einem System und ermöglicht dadurch angeblich besonders natürlich klingende Gespräche. Nova Sonic versteht nicht nur den reinen Text, sondern erfasst auch Nuancen wie Tonfall, Sprechrhythmus und Sprechweise. Besonders interessant ist die Fähigkeit des Systems, den richtigen Zeitpunkt für Antworten zu erkennen und angemessen auf Unterbrechungen zu reagieren.
Die Integration erfolgt über Amazon Bedrock mit einer bidirektionalen Streaming-API, die auch Funktionsaufrufe unterstützt. Entwickler können derzeit zwischen verschiedenen englischen Stimmen und Akzenten wählen, darunter amerikanisches und britisches Englisch. Amazon hat dabei sowohl an maskulin als auch feminin klingende Stimmvarianten gedacht. Ein Beispiel findet ihr hier.
Sicherheit spielt ebenfalls eine Rolle: Nova Sonic kommt mit eingebauten Schutzfunktionen wie Inhaltsmoderation und Wasserzeichen. Amazon positioniert das neue Sprachmodell als besonders effizient im Hinblick auf Preis-Leistung und Latenzzeiten. Ob sich diese Versprechen in der Praxis bewahrheiten, wird sich in den kommenden Monaten zeigen müssen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Hört sich gut an, wann wird… damit ersetzt, kann den Name hier gerade im Raum nicht aussprechen? xD