Google führt neue KI- und Eingabehilfefunktionen für Android und Chrome ein

Apple hat neulich erst seine Bemühungen für die Bedienungshilfen auf seinen Geräten untermauert – nun prescht auch Google nach vorne. Der Konzern rollt pünktlich zum Global Accessibility Awareness Day neue Funktionen aus, die Menschen mit Einschränkungen den Alltag mit Smartphone und Browser erleichtern sollen. Der Schwerpunkt liegt dabei auf KI-gestützten Verbesserungen für Android und Chrome.

Neu ist die Erweiterung von TalkBack, dem Android-Screenreader. Die Integration von Gemini ermöglicht es nun nicht nur Bildbeschreibungen zu generieren, sondern auch Fragen zu Bildern zu stellen. Wenn etwa ein Freund ein Foto seiner neuen Gitarre schickt, können Nutzer nach Details wie Marke und Farbe fragen. Die Funktion arbeitet auch mit kompletten Bildschirminhalten, praktisch beim Online-Shopping.

Für gehörlose Menschen bringt Google die „Expressive Captions“ auf ein neues Level. Die Echtzeit-Untertitel erkennen jetzt auch die Länge von gesprochenen Worten – aus einem einfachen „Tor“ wird dann „Toooooor“ in der Anzeige. Zusätzlich werden mehr Geräusche wie Pfeifen oder Räuspern erkannt. Diese Features gibt es vorerst nur in englischer Sprache und auf Geräten mit Android 15.

Beim Chrome-Browser hat Google ebenfalls nachgelegt. PDF-Dokumente werden jetzt automatisch per OCR analysiert, sodass auch eingescannte Texte mit Screenreadern vorgelesen werden können. Die neue „Page Zoom“-Funktion für Android erlaubt es, Texte zu vergrößern ohne das Layout der Webseite zu beeinflussen – analog zur Desktop-Version.

Für Entwickler öffnet Google die Euphonia-Projektressourcen via GitHub. Damit können sie eigene Audio-Tools entwickeln, die auch nicht-standardisierte Sprache besser erkennen. In Afrika unterstützt Google.org zudem die University College London beim Aufbau von Spracherkennungsmodellen für zehn afrikanische Sprachen.

Auch im Bildungsbereich gibt es Fortschritte: Chromebooks unterstützen nun bei College Board’s Bluebook-Prüfungsapp sämtliche Google-Accessibility-Features wie ChromeVox und Diktierfunktion.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.
Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.