CriticGPT: OpenAI stellt ML-Modell zum Prüfen von ChatGPT-Antworten vor

Machine Learning prüft und kritisiert Machine-Learning-Ergebnisse, um Machine Learning nutzenden Menschen zukünftig bessere Machine-Learning-Ergebnisse anbieten zu können. Oder anders: OpenAI, die Schöpfer von ChatGPT, haben ein neues Modell namens CriticGPT entwickelt, das auf GPT-4 basiert und darauf trainiert wurde, Fehler im Code-Ausgaben von ChatGPT aufzuspüren. Angeblich seien Nutzer mit der Unterstützung von CriticGPT 60 % effektiver bei der Fehlererkennung als ohne, so zumindest die Pressemeldung. GPT-4, die treibende Kraft hinter ChatGPT, ist durch RLHF darauf ausgerichtet, hilfreich und interaktiv zu sein. Was RHLF bedeutet? Reinforcement-Learning from Human Feedback (RLHF) – menschliches Feedback nutzen, um KI-Modelle so zu optimieren, dass sie effizienter selbst lernen.

CriticGPT wurde entwickelt, um durch seine Kritiken Ungenauigkeiten in ChatGPT-Antworten hervorzuheben. Die Vorschläge von CriticGPT sind allerdings ebenfalls nicht immer korrekt, so OpenAI weiter. Hilfreich sei das Konzept dennoch. Warum das System noch lange nicht perfekt ist, erklärt das Unternehmen auch:  CriticGPT ist auf recht kurze ChatGPT-Antworten trainiert worden, zukünftige Modelle müssen vermutlich längere und komplexere Aufgaben verstehen. Fehler, die über viele Teile einer Antwort verteilt sind, können aktuell noch nicht adressiert werden, zudem hat CriticGPT aktuell noch seine Probleme, wenn eine Aufgabe oder Antwort extrem komplex ist.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Nordlicht, Ehemann und Vater. Technik-verliebt und lebt fürs Bloggen. Außerdem: Mail: benjamin@caschys.blog / Mastodon

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

6 Kommentare

  1. „… zukünftige Modelle müssen vermutlich längere und komplexere Aufgaben verstehen. Fehler, die über viele Teile einer Antwort verteilt sind, können aktuell noch nicht adressiert werden, …“
    Und genau deswegen ist es (noch) keine Intelligenz, sondern ein Hype.

  2. Sorry, OT, aber „nutzende Menschen“ statt „Nutzer“ muss echt nicht sein. Ich finde das super-holprig.

    • Der Einleitungssatz war schon bewusst holprig geschrieben 😉

    • Danke für Dein Interesse an dem Thema, Jörg:in. Du solltest aber wissen, dass die Diskussion um Diskriminierungsfreiheit und Inklusion bezüglich des Ausdrucks „DER Mensch“ noch nicht abgeschlossen ist; somit handelt es sich bei „nutzende Menschen“ nur um einen vorübergehenden Kompromiss.

      • Bitte fasse meinen Kommentar als Vorschlag zu eben dieser Diskussion auf, dem mehrfach erfragten Willen der Bürger zu entsprechen und das generische Maskulinum zu nutzen. #demokratie

  3. Das ist doch im Endeffekt nichts anders, als wenn man eine falsche Antwort bekommt und schreibt „probiere es nochmal“ oder „das war falsch“… Und selbst da kommt dann noch oft genug reiner Unsinn…

    Ich habe den Eindruck, der Hype flacht gerade etwas ab und ich bin absolut froh darum..

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.