Google: Künstliche Intelligenz kann einzelne Stimmen in einer Menschenmenge erkennen

von Olli Apr. 14, 2018 | Ein Kommentar

Wenn Menschen mehrere Stimmen gleichzeitig hören, ist es meist relativ einfach diese voneinander zu unterscheiden. Genau mit dieser Herausforderungen haben Stimmerkennungen noch zu kämpfen. Sind mehrere Personen im Raum, fällt es zum Beispiel Alexa sichtlich schwer, die eigentliche Frage zu verstehen und die korrekte Antwort zu geben. Google hat auf seinem Research Blog nun eine Technik vorgestellt, die in der Lage ist, genau diese Aufgabe zu bewältigen.

Dahinter steckt ein Deep-Learning-System, welches spezifische Stimmen erkennen kann, vorausgesetzt es sieht die Gesichter der sprechenden Personen. Das Team trainierte ein neuronales Netz mit verschiedenen gestellten Szenarien, bei denen mehrere Personen sichtbar sprechen und Hintergrundgeräusche präsent waren. Damit konnte die KI lernen, wie man die Stimmen voneinander trennt und in separate Tracks einteilt. Das Ergebnis ist gleichermaßen bemerkenswert wie unheimlich und wird in den folgenden Videos demonstriert:

Google schaut sich gerade an, wie man die Technik in seinen Produkten nutzen kann. Am naheliegendsten ist der Einsatz zur Transkription von YouTube-Videos und Co., was ebenfalls ziemlich gut funktioniert:

Ohne Google etwas Schlechtes unterstellen zu wollen, wissen wir dennoch, dass auch das US-Militär Googles KI-Technologien benutzt. Das wäre dann ein prima Beispiel, um die Überwachung und das Mithören von Gesprächen in Gruppen besser zu machen.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Olli

Hauptberuflich im SAP-Geschäft tätig und treibt gerne Menschen an. Behauptet von sich den Spagat zwischen Familie, Arbeit und dem Interesse für Gadgets und Co. zu meistern. Hat ein Faible für Technik im Allgemeinen. Auch zu finden bei X (Twitter), Threads, Instagram, XING und Linkedin, per Website oder via Mail

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Kasupke says:
15. April 2018 um 08:42 Uhr

Möglicherweise werden ja dann Youtube Videos nach Wörtern oder Sätzen durchsuchbar. Kann ganz nützlich sein…. Negative Effekte nicht ganz auszuschließen

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

Google: Künstliche Intelligenz kann einzelne Stimmen in einer Menschenmenge erkennen

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

Ein Kommentar

Umfrage des Monats

Diese Woche beliebt