Google Gemini Live API: Neue Funktionen für bessere Sprachassistenten

Google DeepMind hat heute ein Update der Gemini Live API vorgestellt, das die Entwicklung von Sprachassistenten verbessern soll. Das native Audio-Modell bringt zwei Verbesserungen mit sich: Eine zuverlässigere Funktionsausführung und natürlichere Gesprächsführung. Die Zuverlässigkeit beim Aufruf externer Dienste wurde laut Google gesteigert. In Tests mit einzelnen Funktionsaufrufen verdoppelte sich die Erfolgsrate. Bei komplexeren Szenarien mit 5 bis 10 Aufrufen stieg sie um 50 Prozent. Das ist wichtig, weil Sprachassistenten in Echtzeit arbeiten und keine Zeit für wiederholte Versuche haben.

Auch bei der Gesprächsführung gibt es Fortschritte, erklärt man weiter. Das System erkennt jetzt besser, wenn Nutzer eine Pause machen oder unterbrochen werden. Nebengespräche werden intelligent ausgefiltert. Wenn zum Beispiel während der Nutzung jemand den Raum betritt und eine Frage stellt, pausiert der Assistent automatisch und macht genau dort weiter, wo das Gespräch unterbrochen wurde. Wer sich dafür interessiert, findet hier mal Demos.

In der nächsten Woche kommt noch eine „Thinking“-Funktion dazu, ähnlich wie bei Gemini 2.5 Flash und Pro. Entwickler können dann festlegen, wie viel Zeit sich das System für komplexe Anfragen nehmen darf. Das System liefert dabei eine textliche Zusammenfassung seiner Überlegungen. Die Preview-Version der aktualisierten Live API steht ab sofort zur Verfügung. Entwickler können die verbesserten Funktionen in Google AI Studio ausprobieren.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.
Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.