Google plant Sprachsteuerung, die auch offline funktioniert

13. März 2016 Kategorie: Google, Mobile, Software & Co, geschrieben von: André Westphal

artikel google logo

Google tüftelt aktuell an einer Sprachsteuerung, die im Gegensatz zu aktuellen Lösungen wie Apple Siri oder Microsoft Cortana bzw. Google Now auch offline funktionieren soll. Gängige Sprachsteuerungen bzw. -assistentinnen sind aktuell auf eine Internetverbindung angewiesen, da die notwendigen Berechnungen in der Cloud stattfinden. Außerdem greifen die Anwendungen wie Siri etwa auf Quellen wie Wikipedia und Wolfram Alpha zu, um auf Anfragen von Anwendern reagieren zu können. Google schreibt sich jedoch nun auf die Fahnen, eine Lösung in petto zu haben, die „schneller als in Echtzeit“ auch ohne Internetverbindung arbeite.

Laufen soll die Anwendung intern bereits auf Smartphones wie dem Nexus 5. Viel Leistung scheint also zum Funktionieren nicht notwendig zu sein. Laut den zuständigen Forschern bei Google sei das Ziel, mit der Offline-Sprachsteuerung neue Wege zu gehen und eine schlanke Anwendung zu präsentieren, die auch lokal Sprachbedienung ermögliche. Aktuell kommen somit wohl nur etwa mehr als 20 MByte für die wichtigsten Dateien der Anwendung zusammen. Auf einem Nexus 5 konnte die Sprachsteuerung bei einem Diktat eine Fehlerquote von 13,5 % bei der Erkennung erreichen.

google new logo

Als Basis dienen der Sprachsteuerung Techniken zum maschinellen Lernen – konkret LSTM (Long Short-Term Memory), RNN (Recurrent Neural Network) und CTC (Connectionist Temporal Classification) sowie SMBR (State-Level Minimum Bayes Risk). Als mögliche Befehle sollen auch offline Eingaben möglich sein wie: „Sende eine E-Mail an Anton Gaston: ‚Können wir den Termin verlegen?'“. Damit die Eingaben verarbeitet werden, müssen aber eben präzise Angaben enthalten sein, wie in diesem Fall der korrekte Name der adressierten Person. Entsprechend benötigt die Offline-Sprachsteuerung z. B. Zugriff auf die jeweilige Kontaktliste. Für das akustische Grundmodell werteten die Forscher rund 2000 Stunden Sprachsuchen bei Google aus und fügte auch Sprachsamples aus YouTube hinzu.

Klingt alles auf dem Papier erstmal super. Doch wann und ob die Offline-Sprachsteuerung auch irgendwann reguläre Nutzer erreichen soll, steht noch in den Sternen.


Über den Autor: André Westphal

Hauptberuflich hilfsbereiter Technik-, Games- und Serien-Geek. Nebenbei Doc in Medienpädagogik und Möchtegern-Schriftsteller. Hofft heimlich eines Tages als Ghostbuster sein Geld zu verdienen oder zumindest das erste Proton Pack der Welt zu testen. Mit geheimniskrämerischem Konto auch bei Facebook zu finden. PayPal-Kaffeespende an den Autor.

André hat bereits 1144 Artikel geschrieben.