Google: Automatische Transkription erkennt Schallereignisse, lässt euch Ergebnisse speichern und exportieren

Bereits im Februar 2019 haben wir euch Googles experimentelle App mit dem sperrigen Namen „Automatische Transkription“ vorgestellt. Die „Automatische Transkription“ verschriftlicht fast in Echtzeit das gesprochene Wort. Beispiel: Ein Freund redet vor euch, dann notiert die App eben alles vor euren Augen auf dem Bildschirm, was jener verbal raushaut. Könnte für Schwerhörige bzw. Taube in vielen Situationen eine große Hilfe sein.

Nun vermeldet Google neue Funktionen, die ab nächsten Monat kommen sollen. Schallereignisse sind eine neue Funktion. Hiermit ist die App in der Lage, Geräusche zu erkennen, kann also visualisieren, ob ein Hund bellt oder jemand an die Tür klopft. Die App wird auch Indikatoren für Dinge wie das Klingeln von Telefonen, Lachen, Autos oder generell Musik bekommen. Wird ein solches Schallereignis wahrgenommen, visualisiert dies die App wie folgt (linker Teil unten):

Die zweite neue Funktion kann auch für jedermann nützlich sein. Live-Transkriptionen lassen sich für bis zu drei Tage speichern, Google nennt hier als Beispiel Journalisten, die gleich ein transkribiertes Interview zur Hand haben könnten. Alternativ kann man dies sicher auch gut als Schüler und Student nutzen. Da muss man allerdings erst einmal genau ausprobieren, wie gut das Ergebnis am Ende ist – ab nächsten Monat dürfte man schlauer sein – hoffentlich auch in Deutschland.

https://play.google.com/store/apps/details?id=com.google.audio.hearing.visualization.accessibility.scribe

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

14 Kommentare

  1. Christian says:

    Auf’m Pixel 3 kann ich die App nur deinstallieren, aber nicht öffnen.
    Bug oder Feature? 😉

    • Läuft auf einem Pixel 2.
      Und läuft ganz gut. Von wegen „punctuation not available“, das ist ziemlich spot on.

      • Wie hast du sie gestartet? Installiert ist sie bei mir auch (als „Vorabversion“), aber ich finde kein Icon im App drawer.

    • Versuch sie mal in den Erweiterten Bedienhilfen zu aktivieren. Bei meinem Samsung taucht dann unten in der Navigationsleiste ein neuer Button auf um sie zu starten – vermutlich ist es beim Pixel ähnlich.

  2. Ist das legal? Muss man denjenigen, den man aufnimmt, darüber informieren?

  3. Ich habe mir das gerade mal angeschaut bzw. getestet. Mit dem Kommentar von DAZN hat die App keine Probleme. Egal wie schnell der redet. Das wird nahezu perfekt aufgenommen. Erschreckend, wie weit die Technik ist. Besonders schräg wird es aber, wenn man die App selbst korrigiert. Beispiel: „Ich habe mich heute morgen mit Karsten getroffen“ wird mit „Ich habe mich heute morgen mit Carsten getroffen“ aufgenommen. Wenn mann dann später ergänzt: „Karsten mit K bitte“, dann erscheint in der App zunächst „Carsten mit K bitte“ und nur 1 bis maximal 2 Sekunden später ändern sich alle vorherigen Zeilen von „Carsten“ in „Karsten“. Erschreckend wie faszinierend zu gleich.

    • Ich finde keine Möglichkeit, den transkribierten Text zu korrigieren. Wie geht das?

      Ebenso nicht, wie @mccrain, zu kopieren, bzw wie @Horton, zu löschen.

  4. Und ich finde nicht die Möglichkeit, den Text kopieren zu können.

  5. Hallo , zur Frage ob man die Einwilligung der Person braucht , deren Gespräch man automatisch mitschreiben läßt: hier dürfte das gleiche gelten wie für tonmitschnitte: nur mit vorheriger einwilligung statthaft. Für Gehörlose wäre es interessant , wenn die App das gehörte in Gebärdensprache z. B. eines Avatar-Bildes übertragen könnte. Und dann die Gebärden einer Person mit der Kamera aufnehmen und in gesprochene oder geschriebene worte übertragen – das wäre der logische nächste Schritt der wohl auch kommen wird. tolle Sache !

    • Wurde bei der Google IO letzte Woche im Form eines Videos gezeigt

      • War das in der Keynote? Ich finde es leider nicht und würde es gerne auf unserer Page für gehörlose und schwerhörige Kinder/Jugendliche verlinken.
        PS: Hab’s gefunden. Live Caption ist das Schlagwort. Danke für den Hinweis! allerdings ist das auch nur Livetranskription von gesprochenem Wort. Für Gebärden funktioniert es nicht. Doch nochmal die ganze I/O-Keynote anschauen.

  6. Ich teste die App schon längere Zeit und habe mich auch schon an den Google Support bzw. das Entwicklerteam gewandt, allerdings ohne eine Antwort bekommen zu haben. Es ist „hilfreich“ gerade für Journalisten dass die App das Interview bis zu 3 Tage sichtbar hält, aber wenn ich den Text benötige, muss ich ihn trotzdem mühsam Wort für Wort manuell abtippen oder manuell zB in ein GoogelDoc kopieren. Was fehlt ist hier eindeutig eine Möglichkeit die Transkription direkt zu speichern.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.