Amazon Alexa: Wenn die Privatsphäre der Nutzer im Meeting-Raum landet

Smart Speaker wie der Amazon Echo sind mittlerweile in vielen Haushalten allgegenwärtig. Man sollte sich bei Benutzung dieser Geräte jedoch immer bewusst sein, dass die gestellten Anfragen in die Cloud gesendet und dort verarbeitet werden, da spielt es keine Rolle, ob es sich um einen HomePod, Google Home oder einen Echo handelt. Die Funktionsweise ist überall dieselbe.

Bloomberg hat mit ein paar ehemaligen Amazon-Mitarbeitern gesprochen, deren Job es war, die von den Echos dieser Welt aufgenommenen Audio-Dateien zu überprüfen, zu transkribieren, entsprechend zu bewerten und dann wieder zum Training in das neuronale Netz von Alexa einzuspeisen. Ja, es gibt Menschen, die sich euer gesprochenes Wort anhören und dabei nicht nur die für Alexa bestimmten Sätze zu hören bekommen.

So treffen sich diese Mitarbeitergruppen beispielsweise in Meetingräumen, um Erfahrungen auszutauschen, herauszufinden, was der Nutzer eigentlich sagen wollte, oder gemeinsam über amüsante Dinge zu lachen, die aufgenommen wurden. Bloomberg nennt den schiefen Gesang der Frau unter der Dusche als Beispiel. Bei dem Review dieser Audio-Dateien – Mitarbeiter sprechen von bis zu 1000 Clips pro Schicht – stößt man auch auf unschöne Dinge. So berichten Mitarbeiter, dass man Dinge hörte, die sich stark nach einem sexuellen Übergriff anhörten. Amazon selbst sagt, dass man Mitarbeitern wohl Möglichkeiten gibt, psychischen Druck der durch das Hören solcher Szenen entsteht, zu verarbeiten. Die Mitarbeiter behaupten jedoch etwas ganz anders, Amazon habe in einem solchen Fall wohl abgewunken mit der Aussage, man seie nicht zuständig.

Wenn die Mitarbeiter Gespräche mithören, wo private Daten wie Bankverbindungen oder ähnliches genannt werden, müssen sie die Datei entsprechend markieren (critical data) und dann mit der nächsten Datei weitermachen. Läuft es euch eiskalt den Rücken herunter? Es geht noch ein bisschen weiter. Theoretisch sollte Alexa nur Dinge aufzeichnen, die nach dem sogenannten Hot oder Wake Word gesprochen werden – also Alexa, Computer oder Echo. Einer der ehemaligen Mitarbeiter spricht davon, dass man täglich mit im Schnitt 100 Aufnahmen konfrontiert wird, wo das Hot Word nicht gesprochen und Alexa aus Versehen getriggert wurde. Ausgehend von den oben genannten 1000 Audio-Clips pro Schicht wäre das eine Quote von ganzen 10 Prozent.

“We have strict technical and operational safeguards, and have a zero tolerance policy for the abuse of our system. Employees do not have direct access to information that can identify the person or account as part of this workflow. All information is treated with high confidentiality and we use multi-factor authentication to restrict access, service encryption and audits of our control environment to protect it.” – Amazon

Laut Amazon sind alle Aufnahmen anonymisiert und der Bearbeiter kann nicht feststellen, um welchen Nutzer es sich bei dem Audio-Clip handelt. Ein Screenshot, der Bloomberg vorliegt, zeigt jedoch, dass man zwar keinen vollen Namen sehen kann, aber der Vorname, die Kundennummer und die Seriennummer des Gerätes an der Datei hängt. So ganz anonym ist das dann doch nicht.

Es ist ganz normal, dass Menschen dazu benötigt werden, Computermodelle anzulernen. Auch bei Siri und dem Google Assistant ist das der Fall. So blind sollte man auch nicht an die Sache herangehen. Dennoch ist es eine Frage des Umgangs mit den Kundendaten. Apple spricht in einem Security Whitepaper davon, dass die Aufnahmen auf dem Server sechs Monate gespeichert werden, keinen persönlichen Daten enthalten und einer zufälligen Nummer zugeordnet sind. Google anonymisiert ebenfalls und verfälscht die Audio-Spur zusätzlich.

Solltet ihr diese persönlichen Assistenten nutzen – und das betrifft nicht nur die Smart Speaker – dann werft einen Blick auf die Datenschutzeinstellungen und die Erklärungen zum Datenschutz bei dem jeweiligen Anbieter. Im Falle von Alexa ist auf dieser Webseite erklärt, wie man eure Daten verarbeitet. In den Datenschutz-Einstellungen von Alexa, könnt ihr die Option zur Verbesserung von Alexa und zur Verarbeitung eurer Aufnahmen auch ausschalten, diese sollten somit nicht mehr durch den oben beschriebenen manuellen Prozess laufen.

Update: Folgendes Statement haben wir von Amazon zu dieser Angelegenheit erhalten:

„Wir nehmen die Sicherheit und den Schutz der personenbezogenen Daten unserer Kunden ernst. Wir versehen nur eine extrem geringe Anzahl von Interaktionen einer zufälligen Gruppe von Kunden mit Anmerkungen, um die Nutzererfahrung zu verbessern. Zum Beispiel helfen uns diese Informationen, unsere Systeme zur Spracherkennung und zum Verständnis natürlicher Sprache zu trainieren. So kann Alexa Anfragen besser verstehen und sicherstellen, dass der Dienst für alle gut funktioniert. Bei uns gelten strenge technische und betriebliche Sicherheitsvorkehrungen und wir verfolgen eine Null-Toleranz-Politik, was den Missbrauch unseres Systems betrifft. Im Rahmen dieses Workflows haben Mitarbeiter keinen direkten Zugriff auf Informationen, die die Person oder das Konto identifizieren können. Wir behandeln Informationen mit hoher Vertraulichkeit, setzen auf eine Multi-Faktor-Authentifizierung zur Zugriffsbeschränkung, eine Verschlüsselung des Dienstes sowie Audits unserer Kontrollumgebung zum Schutz der Daten. Darüber hinaus können unsere Kunden ihre Sprachaufzeichnungen jederzeit löschen.“

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hauptberuflich im SAP-Geschäft tätig und treibt gerne Menschen an. Behauptet von sich den Spagat zwischen Familie, Arbeit und dem Interesse für Gadgets und Co. zu meistern. Hat ein Faible für Technik im Allgemeinen. Auch zu finden bei Twitter, Instagram, XING und Linkedin, oder via Mail

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

19 Kommentare

  1. Interessanter Artikel. Weiß einer zufällig ob es unterschiedlich hohe Quoten für die Aufnahmen ohne „Hot Word“ gibt? Ich hab mir nämlich mal meine Daten im Google Konto angeschaut und konnte nach kurzem suchen keine Aufnahmen ohne Hot Word erkennen. Werden die da überhaupt angezeigt? Oder ist Google in dieser Hinsicht einfach zuverlässiger als Alexa?

    • Ja, Google ist da sehr vorbildlich und transparent, da kann ich alle über mich gespeicherten Daten einsehen und verwalten. Zum Beispiel auch den Standortverlauf.

      Kann man das bei Apple, Amazon und Microsoft eigentlich auch alles, oder rücken sie die Daten, die sie über uns gespeichert haben, gar nicht mehr raus?

      • Bei Amazon geht das auch.
        Man kann die Sprachfiles entweder direkt in der App aufrufen oder unter dem oben genannten Link „Datenschutz-Einstellungen von Alexa“.
        Man kann diese auch jederzeit löschen.

  2. Klaus Mehdorn Travolta says:

    Den letzten Absatz hättest du durchaus dem Artikel voranstellen können… 😉

  3. Mir läuft da nichts eiskalt den Rücken runter. Zum einen ist es nachvollziehbar, wo oben auch steht, dass irgendwo auch mal jemand sitzt, der sich das anhört, zum anderen finde ich auch Daten wie eine Bankverbindung nicht sonderlich kritisch. Aber ich bin auch jemand, der z.B. Veränderungen auf dem Konto recht schnell bemerken würde, wogegen andere vielleicht nur alle paar Wochen mal auf den Kontoauszug schauen. Solange sichergestellt ist, dass das, was die Mitarbeiterinnen und Mitarbeiter dort hören, nicht weiter nach außen getragen oder gar im Internet öffentlich gemacht wird, sehe ich da kein größeres Problem. Schwachpunkt ist da natürlich der „Faktor Mensch“, aber das gibt es überall. Das macht es nicht besser, das Risiko kann aber auch nun mal nicht zu 100% ausgeschlossen werden. Und am Ende ist zumindest mir persönlich ziemlich egal, was Amazon oder ein anderes Unternehmen über mich „weiß“. Sehr viel wichtiger ist, dass mein näheres Umfeld wie Freunde oder Kollegen nicht alles unkontrolliert mitbekommt.

  4. Komisch, ich bekomme es SOFORT mit, wenn ein Echo Device der Meinung war, ein Hotword vernommen zu haben.
    Wieso man dann über seine Bank Daten (die Amazon ja auch hat) weiter redet, erschließt sich mir nicht.
    Oder sprechen die alle im Schlaf?

    • Noch nie jemanden deine Bankverbindung am Telefon diktiert?

      Wie bekommst du das denn SOFORT mit? Unser Dot steht oben auf einem Hängeschrank in der Küche. Nicht der Ort, wo ich dauerhaft hinschaue, wenn ich mit der Tante rede.

      • Also meiner meldet sich mit einem Ton wenn er denkt, daß ich mit ihm reden würde.

      • Na dann steht er da oben vielleicht falsch 😉

        Ab und zu will man es vielleicht stummen, da müsst ihr ja blind bedienen.

    • Es soll tatsächlich Leute geben, die mehr als eine Bankverbindung/Kreditkarte haben und die nicht alle bei Amazon hinterlegen…. Also so ganz an den Haaren herbeigezogen ist das Problem nicht.

  5. Naja… das ist eben der Preis, wenn man solche Geräte nutzt.

    Ich weiß nicht, wie oft sich unser Dot in der Küche angesprochen fühlt. Erfahrungsgemäß hört die Tante bei vielen Nebengeräuschen, die in einer Familienküche nicht selten enormes Ausmaß annehmen können, eher schlechter als besser.

    Die Frage müsste ja auch in dem Fall eher sein, ob man das in der App dann sehen kann, wenn Alexa gelauscht hat, ohne das man sie bewusst angesprochen hat. Erstaunlich ist es aber, dass ich mich selbst oft dabei erwische, Namen wie Alex oder auch wenn ich über Alexa rede, den Namen leiser ausspreche, um sie nicht zu aktivieren. Wobei auf der anderen Seite wiederum das nicht oft vorkommt, wenn man in einem durch redet, statt die kurze Pause nach dem Hot Word zu machen.

    • Wir haben aufgrund unseres Sohnes mit dem Namen Alexander das Hot-Word geändert. Ansonsten hört der Dot im Alltag mit einem 5 jährigen Kind zu oft zu…

    • GooglePayFan says:

      „Die Frage müsste ja auch in dem Fall eher sein, ob man das in der App dann sehen kann, wenn Alexa gelauscht hat, ohne das man sie bewusst angesprochen hat.“

      Ja, steht alles drin. Wenn Alexa merkt, dass das Gesprochene nicht fürs Mikrofon bestimmt war, dann findet übrigens auch keine Auswertung des Gesprochenen statt und in der App steht:
      Audio nicht für Echo beabsichtigt – keine Rückmeldung.

      Eigentlich ist das ganze also ziemlich transparent, man kann genau nachvollziehen, wie oft Alexa getriggert wird ohne dass man dies beabsichtigt hat und somit das „Risiko“ einschätzen.

  6. Als Telefonvermittlung noch Handbetrieb war , konnte jedes Herrlein und Frollein vom Amt im Grunde mithören wenn es das denn wollte und Zeit dazu gehabt hätte. Wird heute bei VoIP-Telefondiensten sicher auch technisch möglich sein … und dennoch hat niemand aufgehört zu telefonieren . Oder Briefe zu schreiben die der Briefträger oder jemand im Postverteilamt hätte lesen können . Ist in der „DDR“ ja auch geschehn und in vielen andern Staaten auch und nicht immer nur nach richterlicher Anordnung. Wo ist das neue bei „Alexa“ und Co? Wer eine Nachricht über Dritte transportiert und nicht selber übrrbringt liefert sich immer aus. Nur weil es jetzt in Form von Smartdevices neu ist ist diese alte Tatsache ein „Aufreger“. Es gab Leute die haben halbe Familiendramen auf offene Postkarten gequetscht und sich nichts dabei gedacht . Seefunkgespräche über Norddeich z. B. , auch Telefonate an Land , wurden offen geführt , jeder mit einem SSB-fähigen KW-Empfänger konnte mithören . Die BOS-Funkdienste arbeiteten mit wenigen Ausnahmen unverwürfelt in offener Sprache in Schmalband-FM , jeder Wurst-und Zwiebel-handscanner konnte das mithören. In einschläigigen Fachbüchern gab es für jedes Bundesland die Kanal-und Rufnamenzuweisungen für die BOS-Funkkreise . Jeder Funkfreak der sich für kommerzielle Funkdienste interessierte war mit einigen Fachkenntnissen und Geräteaufwand dabei , je nach Lage und Antennenaufwand sogar über seinen Wohnort hinaus. Ach ja jetzt geht unsere Welt unter weil Die A.-und Google-Dame und der/die/das Siri mithören. Und Menschen daran arbeiten die Erkennungs- und Antwort-Algorithmen zu verbessern. Oh es ist ja alles so neu und nnoch nie dagewesen !!! Lach !

    • ach ja, ich vergaß : Telegramm-Annahme über Telefon : da hat man _einem Menschen_ sein Telegramm „Oma heut morgen friedlch eingeschlafen , komme sofort “ diktiert incl. Absender- und Herkunftsadresse. Jede Person wie an der Weitergabe des Telegramms beteiligt war kannte im Prinzip den Text – mit Ausnahme des Telegrammboten der per KRad dann auslieferte. War einfach selbverständlich den MitarbeiterInnen bei Post und Co. zu vertrauen . Sind Amazon , Google und Apple und deren Mitarbeiter nun per se böseerer oder verführbarere menschen als Mitarbeiter bei Post und Co.? Nur weil es deutsche (Staats-Unternehmen waren? Wie ihr an meinen beiden Nachrichten erkennt lebe ich schon ein paar jahrzehnte auf der Welt und befasse mich seit Ende der Pubertät mit Funk, elektronik und andern Dingen . Diese Sicht auf „wie es vor 30 Jahren war“ relativiert einige der Aufreger von heute , sei es Klimaschutzwahn oder Angst vor den Leuten die bei Amazon an der Verbesserung des Sprachassistenten arbeiten.

      • Klimaschutzwahn? AfDler? Wer den Klimawandel immer noch leugnet dem ist einfach nicht mehr zu helfen *kopftisch*

        • Hallo Chris, ich habe den sog. „Klimaschutz“ als Wahn bezeichnet . Das heißt nicht daß ich den Klimawandel als solchen leugne. Nur die teil an jeder wirtschaftlichen Vernunft und „Leidensbereitschaft“ der Menschen , z. B. Verkehrsteilnehmer , verbeigehenden hektischen Aktionismusschübe der „stoppt die Klimakatastrophe“-Lobby kritisiere ich. Klimaveränderungen hat es immer gegeben und wird es immer geben . Hier wo ich heute lebe gab es Gletscher und subtropische Wälder im Verlauf der Erdgeschichte. Also Anpassung an die KLimaveränderungen und vorsichtiges , menschengerechtes Umsteuern in Energie – und Verkehrspolitik ja! Wahnhaftes Vernichten von Areitsplätzen (Kohleindustrie, Autoindustrie) – nein ! Das habe ich gemeint , nichts anderes . Wie gesagt : ich bin einer der wohl älteren mitlesenden in diesem Blog. bin in den 50ern geboren. Was habe ich schon alles lesen /hören müssen – z. B. daß angeblich die Lüneburger Heide wegen der Grundwasserentnahme durch Hamburg bis 2020 versteppen würde. Na ist ja noch ein dreiviertel-Jahr Zeit bis diese dystopische Voraussage eintrifft. So sicher wie die „Klimakathastrophe“.

  7. Und wieder kann ich sagen: „Hab ichs euch doch gesagt“ 😀
    Wer die Wanzen freiwillig kauft braucht sich nicht wundern

  8. Andreas_Va says:

    Ich habe es immer gesagt, dass diese Dinger Abhörwanzen sind. So was kommt mir nicht ins Haus!

    In meinem Bekanntenkreis sind einige Leute, die mir stolz immer zeigen oder erklären, was sie alles per Sprache steuern können. Ich antworte immer, dass ich auch alles bequem steuern kann. Ich habe in jedem Raum einen lichtschalter. Es reicht ein einziger Klick und das Licht ist eingeschalltet. Und für sonstige Funktionen habe ich immer einen Schalter. Das funktioniert hervorragend gut, und ich muss mir nicht immer den mund fusselig reden. Ich kann mit den klassischen Schlatern sogar alles wortlos erledigen. Selbst wenn ich mal heiser bin und die Stimme weg ist, funktioniert alles wunderbar. Sollte jeder ruhig mal wieder ausprobieren. Ich liebe diese tolle Erfindung der Schalter. 🙂

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.