ChatGPT-Gespräche landeten im Google-Index

Ein interessantes Phänomen machte die Runde: Google indexierte öffentlich geteilte ChatGPT-Konversationen. Was zunächst harmlos klingt, konnte für einige Nutzer zum Problem werden. Über 70.000 Unterhaltungen mit dem KI-Chatbot waren zwischenzeitlich über die Google-Suche auffindbar. Gestern Abend funktionierte das Ganze im Test auch bei mir, nach der Berichterstattung hat man wohl flugs etwas geändert.
Das Prinzip ist einfach: Wer einen ChatGPT-Chat mit anderen teilen möchte, generiert einen Link. Diese Links waren nicht durch eine robots.txt oder andere technische Maßnahmen vor der Indexierung geschützt. Google nahm sie daher in seinen Suchindex auf. Darunter befanden sich nicht nur kuriose Unterhaltungen, sondern auch sensible Informationen und möglicherweise interne Firmendaten. Dennoch gab es hinterher eine Erklärung.
„ChatGPT-Chats sind nicht öffentlich, es sei denn, Sie teilen sie“, sagte ein OpenAI-Sprecher gegenüber der US-Seite TechCrunch. „Wir haben Möglichkeiten getestet, hilfreiche Gespräche einfacher zu teilen und gleichzeitig den Nutzern die Kontrolle zu lassen. Vor Kurzem haben wir ein Experiment beendet, bei dem Chats in den Suchmaschinenergebnissen angezeigt werden, wenn Sie beim Teilen ausdrücklich zugestimmt haben.“
Mit einer gezielten Suchanfrage nach dem Muster „site:chatgpt.com/share“ plus beliebige Suchbegriffe ließen sich diese Gespräche dann aufspüren. Was Nutzer als private oder halb-private Mitteilung gedacht haben, wurde plötzlich öffentlich sichtbar. Ob sie gelesen haben, dass sie Teil des Experiments waren, ist vermutlich zu bezweifeln.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Ich habe schon öfter das Gefühl gehabt, dass Google über Unterhaltungen mit ChatGPT durchaus Bescheid weiß. Habe es schon öfter beobachten können, dass ich über ChatGPT über Themen gesprochen habe zu denen ich später bei Google Hinweise gefunden habe…..
Das eine hat mit dem anderen nichts zu tun. Wir unterschätzen, wie ähnlich wir anderen sind. Bei 80 Mio Menschen allein in Deutschland ist die Wahrscheinlichkeit hoch, dass jemand anderes ähnliche Fragen und Probleme im Leben hat. Wenn du in ChatGPT nach einer Siebträgermaschine suchst und später dafür Werbung auf Google bekommst, liegt das nicht daran, dass ChatGPT Daten mit Google teilt oder dein Handy “mithört” o.ä. Es liegt daran, dass du ein Mann um die 30 Jahre mit mittlerem Einkommen bist, der aus einer Stadt surft, und damit eine hohe Wahrscheinlichkeit hat eine Siebträgermaschine kaufen zu wollen (mal als Beispiel).
Warum sollte ich in ChatGPT nach Siebträgermaschinen suchen? ChatGPT ist doch keine Suchmaschine.
Ich nutze ChatGPT für Problemlösungen, vorallem komplexer Themen.
weil du(*irgendjmd) dir vllt Gerät 1 mit Gerät 2 vergleichen lassen willst. Was wunderbar über LLMs funktioniert. Nutze ich für einen schnellen ersten Eindruck auch selbst.
Gerade solche recht einfachen Tasks, die aber ein zusammensuchen von Informationen von unterschiedlichen Quellen benötigen, eignen sich für mich ideal um ein LLM damit zu füttern.
Du (ja diesmal DU) bist nicht der Nabel der Welt. Nur weil dein Anwendungsfall nicht beschrieben ist, bedeutet das nicht gleichzeitig, dass es diesen Anwendungsfall nirgends auf der Welt gibt.
also ich nutz chatgpt genau wie ne Suchmaschine. Ich sag such mir eine fräse günstig und dann bekomm ich fast immer die besten Konditionen. man kann viel präziser damit arbeiten als nur Stichworte bei Google
Naja, OpenAI hängt doch in zig Ad-Netzwerken also wenn sie da teilnehmen dann teilen sie auch die Daten.
Sprich, wenn man sich über Wärmedecken bei ChatGPT informiert dann ist die Wahrscheinlichkeit hoch, dass man in der Kategorie „Frierende Senioren“ landet und später deswegen auch passende Werbung im Online-Shop des Vertrauens angezeigt bekommt…
Und Chrome oder Android vorhanden. Und Google als reines Daten- und Werbemonster verwendet einfach Informationen über dich um Cash zu generieren? Krass!!!
Das habe ich auch schon beobachtet; aber nicht nur bei Google
Mir fehlt in der Berichterstattung das Verständnis dafür, was “wenn Sie beim Teilen ausdrücklich zugestimmt haben” heißt. Wenn dem so ist, wo war dann das Problem? Oder haben sie garnicht ausdrücklich zugestimmt? Reicht das Teilen eines Links, oder musste man noch eine Checkbox anklicken?
eine extra Checkbox, hier sieht man einen Screenshot: https://x.com/cryps1s/status/1951041845938499669
Genau, und „halb-öffentlich“, wie im Artikel erwähnt, gibt es schlicht nicht. Das wäre so, als sei man halb schwanger. Ist das etwa schon mal jemanden passiert?! 😉
„und möglicherweise interne Firmendaten“
Bei jeder Firma dürfte es es ein Verbot der Nutzung von ChatGPT und auch z.B. Google Translate oder sonst etwas mit Firmendaten geben.
Wenn man dagegen verstößt, ist das normalerweise ein direkter Kündigungsgrund.
So einfach ist es mit dem kündigen nicht. Dafür müssen die Daten zunächst einmal korrekt Hinsichtlich ihrer Vertraulichkeit klassfiziert sein. Das ist bei uns selten der Fall. Die Daten werden meistens mit der niedrigsten Klasse eingestuft, weil die Leute keine Lust haben, die notwendigen Vorkehrungen zu treffen, die eine andere Einstufung nach sich ziehen würden. Das gilt übrigens auch fürs Management.
Als Nächstes muss nachgewiesen werden, dass der Mitarbeiter geschult worden ist und diese Schulung auch verstanden hat. Irgendein Wisch, Der dem Mitarbeiter mal eben zum unterschreiben vorgelegt wird, ist sicher nicht vor Gericht ausreichend.
Gibt es bei uns explizit nicht. Und wir sind keine kleine Klitsche. Jahresumsatz im 2stelligen Milliardenbereich. Wir müssen es sogar teilweise nutzen um firmeninterne Kommunikation in unsere Landessprache zu übersetzen.
It’s a feature, not a bug. Really? Das OpenAI eine Liste der geteilten Chats offen ins Internet hängt, soll absichtlich gewesen sein? Fände eine archivierte Quelle interessant, aus der hervorgeht, dass sie das vorher kommuniziert haben.
Und so, ihr Lieben, kommt man zum Beispiel an API Keys und andere, spannende Inhalte einer .env Datei. Ich hab es mal eben mit DuckDuckGo probiert und bin gleichermaßen erstaunt wie entsetzt, was man da alles findet. Ich bin gespannt, wann da der Deckel hoch fliegt.
Wie errät Google diese Links? Gibt es da einen Index? Teilen mit URL sollte schon speziellere Links erzeugen als /share/1 bis /share/n..
Da müsste eigentlich eine bessere Unterscheidung her:
öffentlich, nur mit Link oder ggf. Benutzer
Na offensichtlich kann man diese Links irgendwo abfragen, entweder per API oder auf einer Web-Url.
Finde den Sturm im Wasserglas ganz lustig. Das ein Unternehmen wie DeepL das ganz genauso macht und die Inhalte dann auf dazu gehörenden Seiten einstellt (wenn auch sehr gekürzt) zeigt nur, dass man sich schlichtweg darüber im Klaren sein sollte.