Google: Automatische Transkription erkennt Schallereignisse, lässt euch Ergebnisse speichern und exportieren

Bereits im Februar 2019 haben wir euch Googles experimentelle App mit dem sperrigen Namen „Automatische Transkription“ vorgestellt. Die „Automatische Transkription“ verschriftlicht fast in Echtzeit das gesprochene Wort. Beispiel: Ein Freund redet vor euch, dann notiert die App eben alles vor euren Augen auf dem Bildschirm, was jener verbal raushaut. Könnte für Schwerhörige bzw. Taube in vielen Situationen eine große Hilfe sein.

Nun vermeldet Google neue Funktionen, die ab nächsten Monat kommen sollen. Schallereignisse sind eine neue Funktion. Hiermit ist die App in der Lage, Geräusche zu erkennen, kann also visualisieren, ob ein Hund bellt oder jemand an die Tür klopft. Die App wird auch Indikatoren für Dinge wie das Klingeln von Telefonen, Lachen, Autos oder generell Musik bekommen. Wird ein solches Schallereignis wahrgenommen, visualisiert dies die App wie folgt (linker Teil unten):

Die zweite neue Funktion kann auch für jedermann nützlich sein. Live-Transkriptionen lassen sich für bis zu drei Tage speichern, Google nennt hier als Beispiel Journalisten, die gleich ein transkribiertes Interview zur Hand haben könnten. Alternativ kann man dies sicher auch gut als Schüler und Student nutzen. Da muss man allerdings erst einmal genau ausprobieren, wie gut das Ergebnis am Ende ist – ab nächsten Monat dürfte man schlauer sein – hoffentlich auch in Deutschland.

Automatische Transkription
Automatische Transkription
Entwickler: Research at Google
Preis: Kostenlos

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

caschy

Hallo, ich bin Carsten! Baujahr 1977, Dortmunder im Norden, BVB-Getaufter und Gründer dieses Blogs. Auch zu finden bei Twitter, Facebook, Instagram und YouTube. PayPal-Kaffeespende. Mail: carsten@caschys.blog

Das könnte dir auch gefallen…

Mit dem Absenden eines Kommentars willigst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten ein.

14 Kommentare

  1. Christian says:

    Auf’m Pixel 3 kann ich die App nur deinstallieren, aber nicht öffnen.
    Bug oder Feature? 😉

    • Läuft auf einem Pixel 2.
      Und läuft ganz gut. Von wegen „punctuation not available“, das ist ziemlich spot on.

      • Wie hast du sie gestartet? Installiert ist sie bei mir auch (als „Vorabversion“), aber ich finde kein Icon im App drawer.

    • Versuch sie mal in den Erweiterten Bedienhilfen zu aktivieren. Bei meinem Samsung taucht dann unten in der Navigationsleiste ein neuer Button auf um sie zu starten – vermutlich ist es beim Pixel ähnlich.

  2. Ist das legal? Muss man denjenigen, den man aufnimmt, darüber informieren?

  3. Ich habe mir das gerade mal angeschaut bzw. getestet. Mit dem Kommentar von DAZN hat die App keine Probleme. Egal wie schnell der redet. Das wird nahezu perfekt aufgenommen. Erschreckend, wie weit die Technik ist. Besonders schräg wird es aber, wenn man die App selbst korrigiert. Beispiel: „Ich habe mich heute morgen mit Karsten getroffen“ wird mit „Ich habe mich heute morgen mit Carsten getroffen“ aufgenommen. Wenn mann dann später ergänzt: „Karsten mit K bitte“, dann erscheint in der App zunächst „Carsten mit K bitte“ und nur 1 bis maximal 2 Sekunden später ändern sich alle vorherigen Zeilen von „Carsten“ in „Karsten“. Erschreckend wie faszinierend zu gleich.

    • Ich finde keine Möglichkeit, den transkribierten Text zu korrigieren. Wie geht das?

      Ebenso nicht, wie @mccrain, zu kopieren, bzw wie @Horton, zu löschen.

  4. Und ich finde nicht die Möglichkeit, den Text kopieren zu können.

  5. Hallo , zur Frage ob man die Einwilligung der Person braucht , deren Gespräch man automatisch mitschreiben läßt: hier dürfte das gleiche gelten wie für tonmitschnitte: nur mit vorheriger einwilligung statthaft. Für Gehörlose wäre es interessant , wenn die App das gehörte in Gebärdensprache z. B. eines Avatar-Bildes übertragen könnte. Und dann die Gebärden einer Person mit der Kamera aufnehmen und in gesprochene oder geschriebene worte übertragen – das wäre der logische nächste Schritt der wohl auch kommen wird. tolle Sache !

    • Wurde bei der Google IO letzte Woche im Form eines Videos gezeigt

      • War das in der Keynote? Ich finde es leider nicht und würde es gerne auf unserer Page für gehörlose und schwerhörige Kinder/Jugendliche verlinken.
        PS: Hab’s gefunden. Live Caption ist das Schlagwort. Danke für den Hinweis! allerdings ist das auch nur Livetranskription von gesprochenem Wort. Für Gebärden funktioniert es nicht. Doch nochmal die ganze I/O-Keynote anschauen.

  6. Ich teste die App schon längere Zeit und habe mich auch schon an den Google Support bzw. das Entwicklerteam gewandt, allerdings ohne eine Antwort bekommen zu haben. Es ist „hilfreich“ gerade für Journalisten dass die App das Interview bis zu 3 Tage sichtbar hält, aber wenn ich den Text benötige, muss ich ihn trotzdem mühsam Wort für Wort manuell abtippen oder manuell zB in ein GoogelDoc kopieren. Was fehlt ist hier eindeutig eine Möglichkeit die Transkription direkt zu speichern.

Schreibe einen Kommentar zu Leif Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren. Alternativ könnt ihr euch via E-Mail über alle neuen Beiträge hier im Blog informieren lassen. Einfach eure E-Mail-Adresse hier eingeben, dann bekommt ihr 1x täglich morgens eine Zusammenstellung. Mit dem Absenden willigst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.
Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessern. Durch Deinen Besuch stimmst Du dem zu.