Sprachsteuerung für Browser-KI: Opera erweitert Aria um Gesprächsfunktion

Opera hat in seiner Entwicklerversion eine Neuerung für die integrierte Browser-KI Aria vorgestellt. Die künstliche Intelligenz versteht nun Spracheingaben und ermöglicht Gespräche mit den Nutzern. Diese Funktion baut auf der bereits existierenden Vorlesefunktion auf, die im vergangenen Jahr eingeführt wurde. Die technische Umsetzung basiert auf dem Whisper-Spracherkennungsmodell von OpenAI. Für die Ausgabe der Computerstimme nutzt Opera weiterhin Googles Wavenet-Technologie. Das System zeichnet die Gespräche automatisch auf und stellt sie als Text zur Verfügung.

Die Nutzung der Sprachfunktion gestaltet sich unkompliziert. Nach der Installation der aktuellen Opera Developer Version lässt sich Aria über das Symbol in der Seitenleiste öffnen. Ein Klick auf das Mikrofon-Symbol neben der Texteingabe aktiviert die Spracherkennung. Bei der ersten Nutzung muss der Zugriff auf das Mikrofon erlaubt werden. Die Benutzeroberfläche zeigt durch verschiedene Statusmeldungen an, ob Aria zuhört oder eine Anfrage verarbeitet. Das Mikrofon wird nur aktiviert, wenn Aria explizit auf Eingaben wartet. Die KI erkennt selbstständig, wann der Nutzer seine Aussage beendet hat und antwortet dann mit natürlich klingender Stimme.

Aria behält ihre bisherigen Fähigkeiten bei und kann beispielsweise weiterhin Bilder auf Basis von Sprachbefehlen generieren. Nach Beendigung eines Gesprächs wird automatisch eine Textversion des gesamten Dialogs angezeigt. Die neue Sprachsteuerung macht die Interaktion mit der Browser-KI intuitiver und ermöglicht eine natürlichere Kommunikation, so die Entwickler. Sie steht allen Nutzern der Opera Developer Version zur Verfügung.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.