Auch für Microsoft arbeiten Menschen an der Verbesserung von Sprachdiensten
In den letzten Wochen wurde ein Thema sehr heiß hochgekocht: Die Vorgehensweise der Tech-Firmen bei der Verbesserung ihrer Spracherkennungsdienste. Einen kleinen Teil dieser Aufnahmen lassen Google, Amazon und Apple auswerten, um die Systeme zu verbessern. Diese Auswertung erfolgt anonymisiert, allerdings kann es eben vorkommen, dass die Aufnahmen selbst etwas über die Personen verraten.
Google hat die Auswertung nun in Europa für 3 Monate ausgesetzt, Amazon stellt deutlicher heraus, dass auch Menschen die Aufnahmen hören können (und bietet ein Opt-out) und Apple hat die Auswertung ebenfalls erst einmal ausgesetzt. Fehlt eigentlich nur noch Microsoft, denn auch bei denen werden Aufnahmen durch Dritte ausgewertet.
Dabei greift Microsoft nicht nur auf Aufnahmen des Sprachassistenten Cortana zurück, sondern auch auf solche, die über das automatische Übersetzungsfeature von Skype entstehen. Das Ding ist auch hier: Der Nutzer weiß das nicht unbedingt. Denn Microsoft nennt in Erklärungen zur Verbesserung der Dienste lediglich, dass Aufnahmen genutzt werden, um die Dienste zu verbessern. Nicht aber wird erwähnt, dass Menschen diese hören können.
Ebenso gibt es bei Microsoft (noch) kein Opt-out für diese Analyse. So kommt es dann auch, dass Schnipsel von intimen Gesprächen, suchen nach Pornos oder vollständige Adressen bei Dritten landen, die mit der Auswertung beauftragt sind. Damit ist sicher nicht jeder Nutzer einverstanden, der über solche Vorgänge überhaupt nicht Bescheid weiß.
Wichtig ist bei so etwas aber auch immer, das Ganze im Verhältnis zu sehen. Ausgewertet wird generell nur ein sehr kleiner Bruchteil der Aufnahmen, zudem anonymisiert. Dennoch muss das dem Nutzer gegenüber natürlich klar kommuniziert werden und auf Wunsch eben auch unterlassen werden. Allerdings wären die Firmen sicher auch sehr gut beraten, wenn sie solche Verbesserungen im eigenen Haus durchführen würden, alleine schon aus dem Grund, dass sich ein Drittanbieter eben nicht mit Aufnahmen auf den Weg an die Öffentlichkeit macht, wie hier geschehen. Spricht übrigens auch nicht für die Vertrauenswürdigkeit eines Geschäftspartners, wenn er mit den ihm anvertrauten Daten dann auf World Tour geht, vielleicht sollten die Unternehmen auch einfach mal da ansetzen.
Das ganze Thema ist ein sehr schwieriges. Wir wollen perfekt funktionierende Technik, sind aber in den seltensten Fällen dazu bereit, auch Daten herzugeben, um solche Technik überhaupt entwickeln zu können. Bis auf die fehlende Transparenz, das hätte man wirklich bei allen Firmen besser machen können, gibt es hier aber keinen großen Angriffspunkt, der die Firmen in die böse Ecke stellt.
Amazon hat es meiner Meinung nach genau richtig gemacht, die Auswertung nicht auszusetzen, weil sie nun einmal für Verbesserungen nötig ist. Nutzer informieren und ein ordentliches Einverständnis holen, so schwer kann das doch alles gar nicht sein.
Wenn jemand wirklich private Daten von den Nutzern abgreifen wollte, dann zieht er die mit Hilfe einer App direkt von Smartphone auf seine Server. Oder er bietet ne Tastatur an, die alles getippt, inklusiv Passwörtern, an ihn überträgt.
Aber ganz bestimmt lässt man sich dann nicht zufällig erstellte Sprachfetzen übertragen, die erst aufwendig in Schrift umgesetzt und auf nützliche Daten durchsucht werden müssen. Das wäre doch viel zu aufwendig und kompliziert.
Diese ganze Datenschutz-Panik ist deshalb kompletter Blödsinn und lediglich ein Vorwand, um die im vergreisenden Deutschland massiv umsich greifende Neophobie zu schein-rechtfertigen.
oh wunder oh wunder ein computergesteuerter Sprachassitent oder ein Konferenzsystem das aufzeichnet. Was eigentlich schade ist, das jetzt nicht die „richtige“ Diskussion stattfindet, das wäre nämlich ein die sich mal für den Endanwender nicht mehr zu verstehenden AGB die am Anfang dieser Dienste stehen beschäftigt. Hier müsste am Anfang eigentlich ein Set Up stattfinden, wo der Endanwender geführt bewusst für solche Funktionen entscheiden muss, nachdem ihm die Auswirkungen auch erklärt wurden.
Wenn du in nen Biergarten gehst und dort ein „Paulaner“ oder „Reissdorf“ bestellst, dann muss dir der Keller vorher auch nicht erklären, dass das Bier ist und dort ca. 5% Nervengift namens Alkohol enthalten ist. Das steht noch nicht mal in der Karte.
Weil das Allgemeinbildung ist.
Genauso wie dass Sprachassitenten, wie jedes technische Gerät und auch jeder Cloud-Server, von Menschen gewartet und geprüft werden müssen.
Man vor 2 Wochen die Alexa Sau durch die Bild Zeitung gejagt, und nun wie ungewöhnlich Google,M$, Apple machens auch
Ich persönlich möchte nicht, dass diese Dienste meine Daten/Sprachaufzeichnungen verwenden.
Auch keine Sprachschnipsel oder sonstigen Daten-Artefakte.
Allerdings bin ich auch so konsequent und nutze weder Alexa, Cortana noch Siri (oder was es da sonst noch so gibt).