KI-Kopfhörer können einzelne Sprecher deutlicher hörbar machen
Forscher der Universität Washington haben Kopfhörer entwickelt, die dank KI-Unterstützung gezielt auf eine bestimmte Person im Raum ausgerichtet werden können, um ihre Stimme zu verstärken. Das geht also über übliche Transparenzmodi weit hinaus, die regulär einfach die gesamten Umgebungsgeräusche oder die Stimmen aller Anwesenden pushen.
Das entwickelte System nennt sich „Target Speech Hearing“. Damit die Technik funktioniert, muss der Träger der Kopfhörer 3 bis 5 Sekunden gezielt eine Person anvisieren. Anschließend wird dessen Stimme weiter gezielt verstärkt, selbst wenn sie aus dem Blickfeld gerät. Für die kommerzielle Nutzung steht die Entwicklung aber derzeit noch nicht zur Verfügung. Zumal die Anwendung derzeit noch komplex ist.
Zwar kann der Träger modifizierte ANC-Kopfhörer verwenden, das Audiosignal muss dann durch einen Embedded-Computer analysiert und bearbeitet werden. Zudem gibt es noch einen Fehlerbereich von 16°. Möglicherweise wird also bei zwei nebeneinander stehenden Personen der falsche Sprecher verstärkt. Ansonsten läuft es so, dass die einmal erkannte Stimme des Sprechers während der Verstärkung fortlaufend analysiert wird, um durch die neuen Trainingsdaten die Anhebung zu optimieren.
Kommerzielles Potenzial für Hörgeräte
Probanden, die das System bereits testen konnten, beschrieben die Stimmen der Sprecher nach der KI-Bearbeitung als bis zu doppelt so klar, verglichen mit der „normalen“ Wiedergabe über die Kopfhörer. Was könnte man noch verbessern? Aktuell lässt sich nur die Stimme einer einzelnen Person gleichzeitig verstärken. Gibt es also mehrere Redner, kann das Ganze schwierig werden. Obendrein funktioniert das Procedere nur dann, wenn nicht aus derselben Richtung eine ähnlich laute Stimme erklingt.
Die Wissenschaftler arbeiten daran, das System weiter zu verbessern, sodass es für TWS-Earbuds und vor allem Hörgeräte eingesetzt werden könnte. Hilfreich könnte das Ganze z. B. auch bei öffentlichen Reden oder auch Vorlesungen sein, wenn Umgebungsgeräusche möglicherweise die Verständlichkeit des Redners beeinträchtigen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Interessant wäre, ob die Trennung ähnlicher Stimmen sauber funktioniert. Da das ganze letztlich auf einer Frequenzanalyse der Stimme basiert, dürfte das eher schief gehen.