ChatGPT: OpenAI ermöglicht Seitenbetreibern Deaktivierung des Web-Crawlers

von Benjamin Mamerow Aug. 7, 2023 | 7 Kommentare

Nicht jeder Webseitenbetreiber möchte, dass die Informationen auf der eigenen Präsenz vom Crawler der KI von ChatGPT aus dem Hause OpenAI abgegriffen werden. Das Unternehmen hat hierfür nun eine Änderung implementiert, mit der sich genau dagegen widersprechen lässt. OpenAI bietet an, den Web-Crawler daran zu hindern, Informationen von der Webseite zu extrahieren, um damit die GPT-Modelle zu trainieren.

In einem Blogeintrag hat man erklärt, dass Betreiber von Webseiten entweder explizit den GPTBot-Crawler in der Robots.txt-Datei ihrer Webseite ausschließen oder dessen IP-Adresse blockieren können. Webseiten, die durch den GPTBot-Crawler indexiert wurden, könnten potenziell zur Verbesserung zukünftiger Modelle verwendet werden. Dabei werden Quellen, die Paywall-Zugang erfordern, persönlich identifizierbare Informationen (PII) sammeln oder gegen Richtlinien verstoßen, herausgefiltert. Bei Quellen, die diese Ausschlusskriterien nicht erfüllen, könnte der Zugriff des GPTBot auf die Webseite dazu beitragen, die Genauigkeit der KI-Modelle zu erhöhen und deren allgemeine Fähigkeiten sowie Sicherheit zu verbessern, heißt es hier weiter. Mal sehen, wie es damit nun zukünftig weitergehen wird. Immerhin wird es zahlreiche Autoren, Verlage und dergleichen geben, welche von der neuen Option umgehend Gebrauch machen werden.

#	Produkt	Preis
1	FRITZ!WLAN Mesh Repeater 600 (WLAN N bis zu 600 MBit/s (2,4 GHz), WPS, kompakte Bauweise,...	33,90 EUR	Bei Amazon ansehen
2	FRITZ!Repeater 1200 AX (Wi-Fi 6 Repeater mit Zwei Funkeinheiten: 5 GHz-Band (bis zu 2.400 MBit/s),...	73,66 EUR	Bei Amazon ansehen
3	FRITZ!Repeater 2400 (Dual-WLAN AC + N bis zu 1.733 MBit/s (5GHz) + 600 MBit/s(2,4 GHz), 1x...	119,99 EUR	Bei Amazon ansehen

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Benjamin Mamerow

Nordlicht, Ehemann und Vater. Technik-verliebt und lebt fürs Bloggen. Außerdem: Mail: benjamin@caschys.blog / Mastodon

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

GooglePayFan says:
7. August 2023 um 21:29 Uhr

Am Besten bauen alle VT/Fakenews-Blogs und Seiten mit Geschichten sowie Verlage, die Romane vertreiben dies sofort in ihren Quelltext mit ein.

Denn aktuell hält ChatGPT das alles doch durchweg für bare Münze…
- hank says:
  7. August 2023 um 23:09 Uhr
  
  gerade die bauen eher ein Allow ein. Damit die „Wahrheit“ verbreitet wird
- Travis says:
  8. August 2023 um 06:00 Uhr
  
  Ich vermute eher das Gegenteil. Seriöse Seiten werden es aus Urheberrechtsgründen verwenden und damit die Ergebnisse weiter verschlechtert.
Weberli says:
7. August 2023 um 23:40 Uhr

Verbieten diese Verlage eigentlich auch die Verbreitung deren Bücher an Schulen, damit Menschenkinder davon auf keinen Fall lernen können? Menschen machen auch nichts anderes: Eindrücke aufnehmen, variieren, modifizieren – nennt sich dann Kreativität – und reproduzieren. Und Menschen schwafeln genauso Blödsinn, wenn sie keine Ahnung haben.
- Marco says:
  8. August 2023 um 06:58 Uhr
  
  Menschen lernen. KI sammelt nur und speichert ab, um dann fremde Inhalte abzurufen, für die andere Menschen kreativ und fleißig sein mussten. Wenn man das denn wirklich KI nennen möchte, denn so richtig ist es ja wieder einmal keine KI, sondern nur eine Art Antwortmaschine, die vorher das halbe Internet gescannt hat. Inwiefern das nun „cool“ ist, bleibt jedem selbst zu bewerten. Ich für meinen Teil finde das nicht so prall, wenn Inhalte, für die jemand arbeiten musste, um die Schlüsse zu ziehen oder die Recherchen zu sammeln, jetzt einfach so „geklaut“ werden. Nichts anderes ist das. Nur neu verpackt.
- Travis says:
  8. August 2023 um 09:45 Uhr
  
  An Schulen wird aber für die Bücher bezahlt.
Heinrich says:
10. August 2023 um 23:39 Uhr

Jetzt können sie so etwas ja anbieten.
Das verbietet es dem Crawler nur, dass er fortan nicht mehr auf die Webeite zugreifen soll. Was bereits abgegriffen wurde, wird ChatGPT nicht vergessen.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

ChatGPT: OpenAI ermöglicht Seitenbetreibern Deaktivierung des Web-Crawlers

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

7 Kommentare

Umfrage des Monats

Diese Woche beliebt