iOS 8 Beta 4 bringt Spracherkennungs-Streaming

Gestern wurde die vierte Beta von iOS 8 veröffentlicht und so nach und nach trudeln die ganzen Neuerungen ein. Eine weitere davon ist das Streaming der Diktierfunktion und die damit verbundene schnellere Wiedergabe von Text. Nutzt man aktuell die Spracheingabe anstatt die Tastatur zu bemühen, spricht man einen Satz und wartet bis dieser dann geschrieben dort steht. Das ist ab sofort nicht mehr der Fall, die Sprache wird bereits während der Aufnahme an die Apple Server gestreamt, sodass Gesprochenes direkt im Eingabefenster erscheint.

Leider immer noch nicht die von OS X bekannte Offline Spracheingabe „Enhanced Dictation“. An dieser soll Apple aber bereits arbeiten, vielleicht kommt sie ja dann mit iOS 9. In Bezug auf Siri, gerade für Aktionen, die auf dem Gerät stattfinden (Kalendereinträge, Apps öffnen) wäre dies eine schnellere Methode, die dann auch ohne Internetanbindung funktioniert. Aber auch das Einsprechen von längeren Texten sollte mit der neuen Methode besser funktionieren, da etwaige Fehler schneller gesehen werden.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Technik-Freund und App-Fan. In den späten 70ern des letzten Jahrtausends geboren und somit viele technische Fortschritte live miterlebt. Vater der weltbesten Tochter (wie wohl jeder Vater) und Immer-Noch-Nicht-Ehemann der besten Frau der Welt. Außerdem zu finden bei Twitter (privater Account mit nicht immer sinnbehafteten Inhalten) und Instagram. PayPal-Kaffeespende an den Autor.

8 Kommentare

  1. Warum eigtl. dieses ständige Daten hin- und hergeschiebe? Die Nokia Handsets konnten Spracherkennung OnDevice schon vor, ja, knapp 15 Jahren. Fließtexte konnten Desktops schon vor 10 Jahren. Das kann mir keiner erzählen, dass dieses Servererkennen technisch notwendig ist. Und keiner hinterfragts sondern alle findens nur toll! Kein Wunder das Ausspähen heutzutage so leicht und aufwandslos ist wie noch nie.

  2. Lieber Herr Fuchs, wenn man so gar keine Ahnung hat, einfach mal die … halten.

    Darüber hinaus kann man die Qualität der Spracherkennung von den alten Nokias keinesfalls mit der exzellenten Spracherkennung von z.b. Google vergleichen.

  3. +1 für den Fuchs.

  4. coriandreas says:

    Wenn Memristoren (CPU & RAM kombiniert, 2018: 100 TB statt 2014: 64 GB) in smarte Elektronik wandern (in 5 Jahren wohl soweit), wird man technisch/physikalisch keine Server oder Verbindung dazu mehr brauchen. Bis jetzt sind die mobilen Geräte aber noch so leistungsschwach, dass dies einfacher ist, wenn dies ein Rechenzentrum oder Großrechner abwickelt.
    In der Tat, auch heute wird es allemal Zeit, dass die Spracherkennungstechnologie weiter Fortschritte macht. Ich kenne einige schwerhörige Menschen, und da wäre es doch so schön, könnte man sich mit diesen unterhalten ohne ständig Text auf Tablets zu tippen. Google Glass dazu wäre ideal, da man dazu nicht immer ein Gerät in der Hand halten muss, v.a. wenn man zu Fuß unterwegs ist.
    Hoffe dass solche Lösungen bald serienreif sind!

  5. coriandreas says:

    Schön wäre auch mal wieder ein Leistungsvergleich der unterschiedlichen Assistenzsysteme, besonders auch getestet für weitergehende und zukünftige Ansprüche: Google, Apple, Microsoft.
    Danke im voraus!

  6. Soweit ich weiß funktioniert Spracherkennung größtenteils über selbstlernende Algorithmen, welche die Messwerte mit einer Datenbank an bereits erkannten Messwerten vergleichen und den besten Treffer liefern. Ist es auf dem Gerät integriert kann die Menge an Vergleichsdaten nur sehr gering sein, z.B. pro Buchstaben/Laut einige tausend Vergleichsmuster und vllt. noch ein paar für die häufigsten Wörter einer Sprache. Bei einer serverbasierten Analyse kann dahingegen eine Terrabyte große Datenbank durchsucht werden für Vergleichswerte an Testresultaten. Dies verbessert die Algorithmen nicht nur enorm, sollte der Nutzer den Text nicht korrigieren bedeutet dies für Apple, dass er richtig verstanden wurde womit sie die Sprachaufnahme der Person in die Datenbank aufnehmen können und daher ihren Algorithmus automatisch verbessern und die Messwertdatenbank vergrößern.