Smart Speaker hören laut neuer Studie weiterhin unabsichtlich mit

Dass Smart Speaker ab und zu Sachen mithören, die sie eigentlich nicht mithören sollten, ist hier im Blog schon des Öfteren Thema gewesen. Einer neuen Studie zufolge, welche STRG_F, ein Format des NDRs und der Süddeutschen Zeitung, erstellt hat, gibt es da auch weiterhin Probleme. Speziell die Lautsprecher von Amazon fallen negativ auf.

So sollen sich Sprachassistenten bzw. Smart Speaker zu oft ohne klare Aufforderung anknipsen und Gespräche mitschneiden. Dabei sollen auch schon menschliche Mitarbeiter Geschäftsbesprechungen, Dialoge von medizinischem Personal und private Streitigkeiten sowie Sex mitgehört haben, um auszuwerten, wie man die Spracherkennung verbessern könne. Laut der Untersuchung von STRG_F schalten sich die Smart Speaker von Amazon, Apple und Google im Alltag nicht nur bei ihren Erkennungswörtern ( „Alexa“, „Hey Siri“ bzw. „Ok Google“) an, sondern starten oft versehentlich.

Geprüft hatte das konkret eine Forschergruppe der Ruhr-Universität Bochum und des Bochumer Max-Planck-Instituts für Sicherheit und Privatsphäre. Elf Smart Speaker nahm man unter die Lupe. Sie stammten von Apple, Google, Amazon, Microsoft, der Telekom, Xiaomi, Tencent und Baidu. Dabei wurden die Lautsprecher allesamt mehr als 16 Tage mit englischsprachigen TV-Serien, Nachrichten sowie speziellen Tondatenbanken beschallt. Insgesamt kam es zu 735 fehlerhaften Auslösungen.

Sieben Tage malträtierte man die Lautsprecher dann mit deutschsprachigen Sendungen – es kam zu 180 falschen Auslösungen. Laut dem Hamburger Datenschutzbeauftragten Johannes Caspar würden die Hersteller die Kunden auf dieses Problem nicht ausreichend aufmerksam machen. Böse Absichten unterstellt er den Herstellern dabei jedoch nicht. Unterschiede gab es übrigens zwischen Deutsch und Englisch: Während Amazons Geräte bei deutschsprachigen Inhalten am häufigsten eine falsche Aktivierung durchführten, war es bei englischer Sprache Microsoft Cortana.

Die Fehler ergaben sich primär aus ähnlich klingenden Worten. Wurde in einer Serie ein „Daiquiri“ bestellt, vermeinte Apples Lautsprecher „Hey Siri“ zu vernehmen. Bei „Botswana“ horchte dann Cortana auf. Amazons Echos fühlten sich z. B. bei „am Sonntag“ angesprochen und verstanden „Amazon“. Man holte auch Kommentare der Unternehmen ein: Google gab etwa an aktuell keine Auszeichnungen durch Menschen auswerten zu lassen. Das wolle man zwar in Zukunft wieder tun, aber nur wenn Nutzer aktiv zustimmen.

Apple verwies lediglich auf eine alte Stellungnahme vom September 2019, welche erklärt, dass alle Daten nur unter zufälliger Kennung abgespeichert werden. Dies geschehe aber nur bei aktiver Einwilligung der Nutzer, automatisch speichere man keine Audioaufzeichnungen mehr. Amazon gab an die Erkennung stets zu verbessern und nur einen sehr kleinen Bruchteil der Alexa-Anfragen durch Mitarbeiter auszuwerten. Dabei gebe es keine Möglichkeit, die Kunden zu erkennen. Eine aktive Zustimmung fordert Amazon dafür nicht, gibt aber die Möglichkeit eines Opt-Out.

Microsoft antwortete auf eine Anfrage nicht, vermutlich, weil man ohnehin keine Aktien mehr im Markt für Smart Speaker hat. Xiaomi meldete sich und mahnte, dass die Smart Speaker des Unternehmens aktuell nicht für den deutschen Markt vorgesehen und daher auch nicht dafür optimiert seien. Die Deutsche Telekom wiederum gab an, dass zwar Mitarbeiter des Unternehmens einige Transkripte zur Sprachverbesserung analysieren würden, dem könnten Kunden aber in der App widersprechen.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

André Westphal

Hauptberuflich hilfsbereiter Technik-, Games- und Serien-Geek. Nebenbei Doc in Medienpädagogik und Möchtegern-Schriftsteller. Hofft heimlich eines Tages als Ghostbuster sein Geld zu verdienen oder zumindest das erste Proton Pack der Welt zu testen. Mit geheimniskrämerischem Konto auch bei Facebook zu finden. PayPal-Kaffeespende an den Autor.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

17 Kommentare

  1. Das ist nicht schön, trotzdem denke ich, dass das Thema unnötig aufgebauscht wird – mal wieder. Ich habe mit den oben genannten Zahlen mal kurz gerechnet, das entspricht weniger als einer falschen Auslösung pro Stunde. Und ich zumindest hätte bei einem tatsächlichen „Dauerfeuer“ von Text mit deutlich mehr gerechnet. Und vermutlich wären diese Zahlen inzwischen auch geringer, wenn man den Anbietern nicht immer wieder die Auswertung der Sprachaufzeichnungen und damit auch die Verbesserung der Spracherkennung erschweren würde.

    • Denke auch, dass das Thema unnötig aufgebauscht wird zumal Alexa eine Aktivierung, auch eine fälschlicherweise durchgeführte, deutlich über den blauen Ring anzeigt und danach nur wenige Sekunden aktiv bleibt.

    • Das hat nichts mit Dauerfeuer zu tun, sondern um ene größerer Bandbreite an Worten.

  2. Apple löscht fehlerhafte Auslösungen oft auch selbst und sendet diese gar nicht erst weiter zur Auswertung. Das wurde auch nicht bedacht.
    Interessanter wäre außerdem auch eine Überwachung des Netzwerkverkehrs nach den Fehlerhaften Aktivierungen.

  3. Die Studie wurde natürlich nicht von SZ und NDR erstellt, sondern von der RUB Universität und dem MPI-SP.
    Dass man einen derartigen Medienrummel erzeugt (inclusive eigener website: unacceptable-privacy.github.io), aber das Paper und die Daten (noch) nicht öffentlich zur Verfügung stellt, ist allerdings ziemlich fragwürdig.

    • Studien zeigen immer das Ergebnis, das sich der Auftraggeber wünscht………
      Würde man die Fragestellungen und die Daten veröffentlichen, könnten poese Leute ja auf den Gedanken kommen, Kritik zu üben….. das geht ja nun gar nicht.
      Das der NDR und die SZ nicht gerade die Ausgeburt an Objektivität sind, ist ja kein großes Geheimnis.

      • > Das der NDR und die SZ nicht gerade die Ausgeburt an Objektivität sind, ist ja kein großes Geheimnis.

        Ich will nicht sagen, dass Smart Speaker böse sind – ich bin selbst ein Fan. Aber inwiefern haben NDR und SZ da einen besonderen Ruf, hast Du Links dazu?

      • Schmarrn von jemanden, der offensichtlich keinen Kontakt zur Wissenschaft hat. rUB ist die Ruhruni Bochum. Sie betreiben keine Auftragsforschung sondern Grundlagenforschung, d.h. das, was sie interessiert.

  4. Deswegen steht bei mir im Wohnzimmer keine Alexa mehr. Ich war regelrecht erschrocken als ich mal ein paar Aufzeichnungen angehört habe. Man konnte problemlos nachvollziehen, was sich im Raum, zum Zeitpunkt der Aufzeichnung, abgespielt hat. Jeder wie er will, für mich kommt das nicht mehr infrage. Die spontanen Aufzeichnungen waren sehr häufig. Ich denke das wird noch Jahre dauern bis das nicht mehr in diesen Ausmaßen vorkommt. Den einen Vorteil bekommt man nicht ohne den anderen Nachteil. Mein Google Home Nest hat sich noch nie spontan eingeschaltet.

    • Zumindest bisher habe ich noch von keinem Fall gehört, in dem sich so ein Echo tatsächlich spontan eingeschaltet und etwas aufgezeichnet hat, sondern erst, wenn das Aktivierungswort (fälschlich) erkannt wurde. Und das ist was völlig anderes, als wenn die Aufzeichnung ganz ohne Anstoß von außen startet.

      • Dafür kenne ich vier Personen, die das sehr wohl erlebten. Meine Frau gehäuft (nutzt FB leider), deren Freundin, indirekt jemanden über einen nict IT fremden und letztlich einen IT Spezialisten, der genau im Bereich Übbrwachung und Abwehr tatig ist. Abgesehen davon, wenn die nicht einmal hinbekommen, daß das Signalwort richtig erkannt wird, wie fehlerhaft muß dann der Rest sein, wo die Dienste nicht zwischen Ja oder nein unterscheiden müssen, sondern auf Inhalte achten?

  5. Viele „Aufzeichnungen“ werden auch lokal ausgewertet oder gar nicht erst verarbeitet was nicht erwähnt wird, aber ersichtlich ist als die Exceldatei mit fehlerhaften Aktivierungen gezeigt wird

  6. Sommerloch…

  7. mike fedders says:

    Xiaomi stellt übrigens zumindest den Echo Plus her, konnte ich deutlich in einer EMail erkennen für ein Austauschgerät, das ich erhalten habe.

  8. Der erste große Hype ist sowieso vorbei. Am Anfang war ich richtig begeistert. Mittlerweile hat sich die Faszination schon lange gelegt. Alexa ist halt ein bequemer Lichtschalter, Wecker, Einkaufsliste und Dudelradio. Amazon hatte jetzt so viel Zeit die Röhre besser zu gestalten. Passiert ist im Grunde nicht besonders viel, eigentlich schade.
    Das Skill System ist immer noch so umständlich wie am Anfang. „Das weiß ich leider nicht“ oder „welches Gerät meintest Du“ usw. höre ich viel zu häufig.

  9. Mich nervt das bei jedem Update wegen hört zu meine Alexa mich weniger versteht. Also am Anfang konnte ich egal wo ohne Proble Alexa sagen und Sie hat gehört. Heute muss man die schon anschreien damit Sie noch aktiviert wird. Nervt tierisch.

  10. Ok bubu

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren. Alternativ könnt ihr euch via E-Mail über alle neuen Beiträge hier im Blog informieren lassen. Einfach eure E-Mail-Adresse hier eingeben, dann bekommt ihr 1x täglich morgens eine Zusammenstellung. Mit dem Absenden willigst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.