Google Home: Mitarbeiter hören sich Sprachaufzeichnungen an

von André Westphal Jul 11, 2019 | 38 Kommentare

Im Bezug auf Sprachsteuerungen bzw. digitale Assistenten, meint man manchmal, es scheine nur Schwarz und Weiß zu geben: Die einen feiern sie als großartige Neuerung, die das Leben vereinfacht, die anderen verdammen sie als Spionage-Tool der Konzerne. Beide Seiten können natürlich Argumente für ihre Ansichten finden. Nun gibt es wieder einen Punkt für die Kritiker: Denn Google beauftragt Mitarbeiter sich eure Spracheingaben bewusst anzuhören.

Dazu muss man aber sagen: Um den Inhalt geht es den Google-Mitarbeitern bzw. den beauftragten Dienstleistern des Unternehmens nicht. Vielmehr möchte man die Spracherkennung verbessern. Es geht also nicht darum, was gesagt wird, sondern wie es gesagt und erkannt wird. Google informiert zudem auch in seinen Richtlinien darüber, dass Spracheingaben in Verbindung mit Google Home bzw. dem Google Assistant aufgezeichnet und anonymisiert ausgewertet werden.

Klarer machen müsste das Unternehmen aber, dass es tatsächlich menschliche Mitarbeiter gibt, welche sich die Aufzeichnungen anhören. Denn das bleibt aktuell schleierhaft. Genauer hatte sich die Seite VRT NWS mit dem Thema beschäftigt. Die angewandten Methoden sind aber strittig, da man sich von einem der Google-Dienstleister die Audioaufnahmen beschaffte. Wobei genau dieser Kniff vielleicht auch zeigt: Sobald Menschen beteiligt sind, ist der Mensch die größte Sicherheitslücke. Wie in diesem Fall, in dem sich Journalisten Zugriff verschaffen.

Allerdings sprechen die Kollegen auch Probleme an, über die wohl noch diskutiert werden müsste: Etwa haben die Mitarbeiter, welche sich die Aufzeichnungen anhören, klare Arbeitsaufträge. Allerdings ist unklar, wie etwa in Situationen gehandelt werden soll, in denen das Material moralische Fragen aufwirft: Wenn es etwa verbale Auseinandersetzungen gibt und womöglich sogar häusliche Gewalt, um nur ein Beispiel zu nennen.

Oft wird das Hotword „Ok, Google“ auch immer noch fälschlicherweise erkannt und es erfolgen Aufzeichnungen, wenn dies eigentlich gar nicht gewünscht gewesen ist. Auch hier nutzt Google aber das Material, um die Spracherkennung zu verbessern. Wie bereits erwähnt: Google weist klar aus, dass alles mitgeschnitten und auch analysiert wird. Aber vermutlich sind sich viele Nutzer eben nicht bewusst, dass menschliche Mitarbeiter den Aufzeichnungen lauschen – wenn auch anonymisiert.

Doch sobald Namen und Adressen genannt werden, sind die Identitäten der Sprecher oft leicht ermittelbar. Hexenwerk ist das also nicht. Google selbst hat seine Vorgehensweise hingegen verteidigt: Man analysiere einen kleinen Teil der aufgezeichneten Audio-Dateien von Hand, um die Techniken zur Spracherkennung zu verbessern. Es gehe hier aber nur um ca. 0,2 % der aufgezeichneten Daten. Und jene Arbeit sei notwendig, um den Google Assistant weiter zu entwickeln.

Letzten Endes kann man Google sicherlich keine bösen Absichten nachsagen und es sei auch erwähnt, dass Amazon und auch Apple bekanntermaßen sehr ähnlich arbeiten. Der Knackpunkt ist aber, dass das Unternehmen klarer darüber informieren sollte, wie die Aufzeichnungen intern behandelt werden.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

André Westphal

Hauptberuflich hilfsbereiter Technik-, Games- und Serien-Geek. Nebenbei Doc in Medienpädagogik und Möchtegern-Schriftsteller. Hofft heimlich eines Tages als Ghostbuster sein Geld zu verdienen oder zumindest das erste Proton Pack der Welt zu testen. Mit geheimniskrämerischem Konto auch bei Facebook zu finden.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

BME says:
11. Juli 2019 um 13:27 Uhr

Nüchtern betrachtet finde ich es nicht gut kann aber gut verstehen das man für die Weiterentwicklung auch menschliche Analyse und Einordnung braucht. Mit reinen Algorithmen geht es einfach nicht. Das sollte ja jedem klar sein. Ich nutze zwar Alexa finde aber auch, das Sprachassistenten noch immer echt am Anfang stehen. Besonders wenn ich bei Alexa eigene Routinen anlege. Da muss ich mich für einen Satz entscheiden. Lege ich also an: Alexa sauge die Wohnung und jemand sagt: Alexa saug die Wohnung dann passiert nichts. Kontext Kontext Kontext, das ist wichtig und das geht nur durch menschliche Kontrolle.
- DerPan says:
  11. Juli 2019 um 13:57 Uhr
  
  naja der unterschied zwischen „saug“ und „sauge“ lässt sich ja über ne Ähnlichkeitsanalyse leicht abfangen, so dass beides funktioniert wenn ein Treshold bei der Analyse unterschritten wird. Wäre ja ein klacks sowas zu implementieren. Viel schwieriger fände ich da „Alexa saug die Wohnung“ und „Alexa, bitte Wohnung saugen“ als gleichwertig zu erkennen.
max says:
11. Juli 2019 um 13:39 Uhr

Die Google-App wird bei mir standardmäßig runter gekratzt, dann ist der As(s)i auch weg. Siri ist unter iOS deaktiviert und Alexa wird gar nicht installiert bzw die Mikros der Fire-TV Fernbedienungen außer Gefecht gesetzt!
Ich trau dem Braten nicht!
- Rama says:
  11. Juli 2019 um 14:10 Uhr
  
  Da kann man nur hoffen, dass du das Mikro an deinem Smartphone ebenfalls ausser Gefecht gesetzt hast.
  - max says:
    11. Juli 2019 um 14:24 Uhr
    
    Troll woanders…
    - DerPan says:
      11. Juli 2019 um 14:41 Uhr
      
      Wieso er hat doch recht. Prinzipiell kann jede App die Zugriff auf dein Mikro im Smartphone hat dieses als Wanze verwenden und dich abhören. Genau wie alle deiner beschrieben Dinge auch.
      - Rama says:
        11. Juli 2019 um 15:49 Uhr
        
        Aber er denkt doch er ist sooooo schlau. Er sollte mal den Kauf einer Alurolle in Erwägung ziehen, da kann man sich nette Sachen daraus basteln, die bei akutem Verfolgungswahn nützlich sein könnten.
    - ellnipso says:
      11. Juli 2019 um 18:06 Uhr
      
      Er hat dich absolut recht. Wenn man derart paranoid ist und das zu Ende denkt darfst Du Dich mit quasi keiner Elektronik umgeben, und natürlich nicht vor die Haustür außerhalb von Wald und Wiesen.
      - max says:
        11. Juli 2019 um 18:41 Uhr
        
        Nein, hat er nicht! Informiere dich bitte darüber wie der Zugriff auf Hardware erfolgt, APIs, Hintergrunddienste, etc.pp. Dass dich ein Smartphone „einfach so Mal“ abhören kann, ohne dein Zutun, nur weil es ein Mikro hat, ist ein Mythos! Von irgendwelche Elektronik, Mal ganz abgesehen… Oder stand im Bild, das dich auch dein Satreceiver, Hifi Verstärker, Radiowecker, etc., dich abhören kann?! Das willst du echt mit einem Gerät vergleichen, wo ein Sprachassistenten -was sich nicht deaktivieren lässt- integriert ist und oft falsch triggert -was die Hersteller auch offen einräumen- vergleichen?.. OK, das ist mir zu spookie, da bin ich raus!
        
        elknipso says:
        11. Juli 2019 um 18:52 Uhr
        
        Du interpretierst in meinen Beitrag eine Menge rein, das so nicht da steht.
        
        Rama says:
        12. Juli 2019 um 01:23 Uhr
        
        @max
        Du kaufst dir am Besten einen Aluhut und wirst damit glücklich. Naiv? Ja das bist alleine nur du!
        
        Rama says:
        12. Juli 2019 um 01:47 Uhr
        
        Ach hör doch auf, es geht ja noch nicht mal um das Mikro…du kannst auch mit deinem Smartphone überall geortet werden, selbst wenn du es ausschaltest. Glaub mir, ich habe alle Teile von „Mission Impossible“ geschaut, nicht umsonst wird in den Filmen die SIM-Karte aus den Handys entfernt und dann beides zerstört. Und was in den Filmen gezeigt wird, muss ja wohl stimmen.
        
        DerPan says:
        12. Juli 2019 um 07:41 Uhr
        
        Das ist kein Mythos, denn jede App der du bei der Installation Zugriff auf dein Mikro erlaubt hast kann dieses jederzeit einschalten und dich jederzeit abhören wenn sie will ohne dass du es merkst!
        
        Eine App der du heute noch vertraust, kann morgen schon nach China verkauft und Böse sein.
        
        Aber dein Aluhut hilft natürlich gegen all das!
        
        DerPan says:
        12. Juli 2019 um 10:48 Uhr
        
        Ja klar aber das machst du ja nicht jedes mal bevor du die App benutzen willst. Mikro erlauben … App benutzen … Mikro verbieten. Bischen umständlich. Also du vertraust der App und willst sie nutzen oder eben nicht.
- Mr. T says:
  11. Juli 2019 um 18:42 Uhr
  
  Herrlich diese Leute mit den Aluhüten :-))
  - max says:
    11. Juli 2019 um 18:50 Uhr
    
    Herrlich diese naive Leute, die nichts zu verbergen haben… 😉
Markus says:
11. Juli 2019 um 13:44 Uhr

Das ging bei Amazon Alexa kürzlich ebenfalls durch die Presse, weil es dort – wie bei *jedem* Sprachassitenten – genauso ist.

Der Grund ist ganz einfach und logisch nachvollziehbar :

Nur ein Mensch kann kontrollieren, ob eine Maschine die wandelbare menschliche Sprache immer richtig versteht und interpretiert.

So lange Maschinen bzw Software neue modische Wörter und Redensarten noch nicht selbst lernen und das gelernte selbständig kontrollieren und verbessern können, kann das nur ein Mensch.

Die Vorstellung Computer wären irgendwann so intelligent, dass sie selbstständig lernen und verstehen, was mit neuen Wörtern, Redensarten und Dialekten im jeweiligen Zusammenhang wirklich gemeint ist, ist möglicherweise noch gruseliger.
Dann hat der Computer vermutlich schon ein eigenes Bewußtsein (Skynet, WOPR usw.). 😀
icancompute aka Peter says:
11. Juli 2019 um 13:48 Uhr

Ich glaube den Unternehmen schon nicht, dass sie Daten wirklich löschen, wenn ich irgendwo auf einen Löschen-Button im Browser klicke. Warum sollte ich also glauben, dass Daten anonymisiert verarbeitet werden? Irgendwo hat sicher jemand den Schlüssel, die anonymisierten Daten zuordnen zu können. Das wird sicherlich nicht zum Tagesgeschäft gehören. Aber kann mir ja keiner erzählen, das ginge absolut nicht. Immerhin sind US Unternehmen bei einem NSL dazu gesetzlich genötigt, klare Auskünfte geben zu können.
- Mike says:
  11. Juli 2019 um 17:37 Uhr
  
  die Frage ist doch: willst du immer das Schlimmste annehmen? Mir würde da zuviel Spaß vergehen. Daher informiere ich mich gern über diese Themen, gehe aber nicht grundsätzlich von Missbrauch aus, der systembedigt nie auszuschließen ist, auch nicht in einer analogen Welt.
sunworker says:
11. Juli 2019 um 13:51 Uhr

„Es gehe hier aber nur um ca. 0,2 % der aufgezeichneten Daten.“

Das bedeutet das täglich Millionen Gespräche von Mitarbeitern analysiert (=abgehört) werden. Da finde ich das Wort „nur“ unpassend.
- Markus says:
  11. Juli 2019 um 14:02 Uhr
  
  Vermutlich werden die wie bei Amazon Alexa abgetippt und sobald was kritisches, wie Passwörter oder Liebeserklärungen dabei sind, wird das als kritisch markiert und gelöscht.
  
  Anders kann man einen Sprachassitenten nicht verbessern. Das geht nur so. Damit kann man aber doch leben.
  
  Die Mitarbeiter bei der Krankenkasse haben auch meinen Krankheitsverlauf und wer abhören will, der kann das sowieso. Wenn mich mein Nachbar oder Kollege abhört, wäre mir das unangenehmer als wenn das irgendwer in Weit-weit-weg macht, der mich garnicht kennt.
Fraggle says:
11. Juli 2019 um 13:59 Uhr

Wenn ein Gerät nicht einmal das Buzzwort richtig erkennt, wie soll ich dann überhaupt Vertrauen in dei korrekte Erkennung von ganzen Sätzen legen können? Der Erkennungssatz Ok Google sollte ich doch recht klar von allen anderen Dingen unterscheiden. „Aus Versehen“ Aktivierungen sollten also auf jeden Fall ausgeklammert sein.
Und daß es aus Versehen geschieht, bezweifel ich, immerhin kann dies wunderbar für personalisierte Werbung verwendet werden. Und damit verdient Google auch sein Geld.

Achja, schwarz-weiß würde ich nicht sagen, denn viele Kritiker gestehen der Spracherkennung eine Bereichung zu, sie hinterfragen nur, warum es nicht offline geschieht.
- Mike says:
  11. Juli 2019 um 17:38 Uhr
  
  weil Siri seit Jahren zeigt, was dann davon übrig bleibt
Rama says:
11. Juli 2019 um 13:59 Uhr

Liest sich ja mal wieder so, als würde man „abgehört“, dabei wird ja nur das aufgezeichnet, was man nach „Ok Google“ sagt.

Wie wird denn häusliche Gewalt aufgezeichnet? Ungefähr so? Ok, Google…wo befindet sich gerade mein Ehemann? Google: In der Kneipe um die Ecke. Ok, Google…wenn er nachhause kommt, haue ich ihm paar auf’s Maul. 😀
- Fraggle says:
  11. Juli 2019 um 20:29 Uhr
  
  Eben nicht. Nach einer anderen Quelle sind 153 von 1000 manuell überprüften Mitschnitte ohne Ok Google aufgezeichnet worden. Kurz gesagt, 15% Fehlerquote bei einem festen Begriff. Krass.
  - Rama says:
    12. Juli 2019 um 01:39 Uhr
    
    Alle Aufzeichnungen, auch die über Falschinterpretation des „Ok Google“ gespeichert wurden, lassen sich im Google-Konto einsehen und löschen. Es erfolgt keine Aufzeichnung von Gesprächen, die nicht vorher durch „Ok Google“ oder durch eine evtl. Falschinterpretation generiert wurden. Alle Aufzeichnungen sind einsehbar und und vor allem löschbar, wenn eine Auswertung nicht gewünscht ist.
Kalle says:
11. Juli 2019 um 14:25 Uhr

> Der Knackpunkt ist aber, dass das Unternehmen klarer darüber informieren sollte, wie die Aufzeichnungen intern behandelt werden.

Nicht intern sondern extern, das ist der Knackpunkt. Eine paar Jahre lang konnte man sich bei CrowdFlower (jetzt Figure Eight) anmelden und Aufzeichnungen anhören und vergleichen, dazu musste man nicht mal Angestellter sein. Pro 10 Aufnahmen bekam man einen Cent.

Haaring wird es wenn die Daten nicht mehr anonymisiert werden. Figure Eight wird heute von Spotify eingesetzt um die Stimmung der Nutzer zu ermitteln und passende Werbung anzuzeigen.
Steffen says:
11. Juli 2019 um 14:33 Uhr

Wer hätte das gedacht?
Chris says:
11. Juli 2019 um 14:51 Uhr

Hahahahaha, ich liebe es. Honecker und Mielke würden sich einen Ast lachen.
Erich, siehste das? Dein Traum wird wahr.
Georg says:
11. Juli 2019 um 15:32 Uhr

So, habe meinen weggeworfen.
Michael says:
11. Juli 2019 um 16:08 Uhr

Ich habe diese Analyse für ein paar Jahre als Nebenjob im Studium gemacht.

Da bleibt überhaupt keine Zeit, sich Gedanken zu machen, wenn man die Sprachnachrichten anhört und die Transkription prüft.

Allerdings lernt man eine Menge Dinge über die Gesellschaft. Wie vereinsamt viele Menschen sind. Wie rassistisch und sexistisch. Und wie manche Eltern im Hintergrund ihre Kinder dazu auffordern, auch brav bitte und danke zu sagen, wenn die Kinder Sprachassistenten nach Mathelösungen fragen.
Jeeve Stops says:
11. Juli 2019 um 16:42 Uhr

Das Argument, es würden nur Mensch kontrollieren können, ob eine Maschine die wandelbare menschliche Sprache immer richtig versteht und interpretiert, halte ich für Augenwischerei.

Das wäre ja so, als würde ich Banksoftware entwickeln und statt Testdaten Echtdaten verwenden, die nur halbgar anonymisiert sind. Man könnte ja einen Qualitätszirkel aufsetzen, die freiwilligen Teilnehmer auf die Auswertung hinweisen und alle anderen Daten in Ruhe lassen. So wie das aktuell läuft ist das unprofessionell und fragwürdig.
- Levin says:
  12. Juli 2019 um 10:40 Uhr
  
  Wenn ich die Möglichkeit habe, würde ich immer auf Echtdaten zurückgreifen. Testdaten bilden leider selten die Realität ab. Man muss natürlich behutsam mit Echtdaten umgehen, aber für eine effiziente Weiterentwicklung sind diese unverzichtbar.
HDS says:
11. Juli 2019 um 17:46 Uhr

Vor 2-3 Tagen durfte man sich hier noch dumme Kommentare von einigen anhören weil Leute vor dem Abhören warnten. Schwups kommt heute ein Beitrag dazu der genau das bestätigt.
Wo sind denn jetzt die Schlauberger von vor 3-Tagen? Fällt euch nichts mehr dazu ein?
Z.B. Herr Kunze: „Kunze
7. Juli 2019 um 18:15 Uhr
Wo bleiben die Trolle, die sich wieder über ne Wanze beklagen??“
- max says:
  11. Juli 2019 um 18:57 Uhr
  
  Weiter oben… 😀
- Rama says:
  12. Juli 2019 um 01:26 Uhr
  
  Immer beim Thema bleiben, gell? Wenn du auf den Artikel über Zoom anspielst, dann hat das nichts mit Sprachassistenten zu tun.
ellnipso says:
11. Juli 2019 um 17:59 Uhr

Wie naiv ist es denn bitte zu glauben, dass sich solche Aufnahmen nicht mal ein Entwickler der Firma und damit ein Mensch im Rahmen der Qualitätskontrolle und Produkt Verbesserung anhört?

Bei aller liebe, aber um das zu glauben und nun ernsthaft überrascht zu sein, muss man schon verdammt naiv durch die Welt laufen.
Fraggle says:
11. Juli 2019 um 20:31 Uhr

Laut Computerbase waren es deutlich mehr als 0,2% nämlich knapp 15%:
„..an mehr als 1.000 solcher Aufnahmen, die über die Smartphone-App Google Assistant erstellt wurden, gelangt und habe hineingehört. Da nicht nur bewusst mit dem Sprachbefehl „Okay Google“ initiierte Sprachaufzeichnungen, sondern auch 153 durch eine Fehlinterpretation der Spracherkennung unbewusst erfolgte Audioaufnahmen darunter waren,…“

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

Google Home: Mitarbeiter hören sich Sprachaufzeichnungen an

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

38 Kommentare

Diese Woche beliebt

Umfrage des Monats