OpenAI präsentiert Operator: KI-Agent für Webinteraktionen
OpenAI hat einen neuen KI-Agenten namens „Operator“ vorgestellt, der in der Lage ist, Aufgaben im Web für Nutzer auszuführen. Der Agent kann Webseiten betrachten und mit ihnen interagieren, indem er tippt, klickt und scrollt. Zunächst wird Operator in den USA für Abonnenten des ChatGPT Pro-Tarifs (immerhin rund 200 € pro Monat) verfügbar sein.
Der Agent basiert auf einem „Computer-Using Agent“-Modell, das die Sehfähigkeiten von GPT-4o mit fortschrittlichem Reasoning durch Reinforcement Learning kombinieren soll. Dadurch kann Operator mit grafischen Benutzeroberflächen interagieren, ohne dass spezielle API-Integrationen erforderlich sind.
Besonders interessant hierbei: Operator kann sich selbst korrigieren und gibt die Kontrolle an den Nutzer ab, wenn er nicht weiterkommt. Bei sensiblen Informationen wie Login-Daten fordert der Agent den Nutzer zur Übernahme auf und soll auch bei Aktionen wie dem Versenden von E-Mails um Erlaubnis bitten. Spätestens hier wird sicherlich der eine oder andere Nutzer vermutlich eher noch einmal in sich gehen, wem oder was er da nun seine Informationen preisgibt.
OpenAI arbeitet mit Unternehmen wie DoorDash, Instacart und Uber zusammen, um sicherzustellen, dass Operator „reale Bedürfnisse adressiert“ und „etablierte Normen respektiert“. Allerdings warnt das Unternehmen, dass noch nicht alles perfekt funktionieren könnte – besonders komplexe Aufgaben wie das Erstellen von Präsentationen oder Kalender-Management bereiten noch Probleme. In Zukunft plant OpenAI, Operator auch für Plus-, Team- und Enterprise-Nutzer verfügbar zu machen und die Fähigkeiten in ChatGPT zu integrieren.
Meine Meinung: Operator klingt durchaus spannend, aber wie immer bei neuen KI-Technologien ist Vorsicht geboten. Es bleibt abzuwarten, wie gut der Agent in der Praxis funktioniert und welche Sicherheits- und ethischen Fragen sich möglicherweise ergeben.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.
Ah, super Tool um Fake-Bewertungen, Fake-Klicks, Fake-Posts etc. zu erzeugen. Ich gründe dann morgen mal ein neues Dienstleistungsunternehmen.
Ich verstehe nur nicht wozu man einen IT-Agent baut, welcher dann mit einer für Menschen gemachten Schnittstelle arbeiten soll, statt direkt mit einer IT-Schnittstelle/API zu interagieren.
Ansonsten klingt es irgendwie danach, dass sich IT demnächst mit sich selbst beschäftigt:
KI-Modelle entwickeln Software und andere KI-Modelle nutzen diese Software. Wozu noch der Mensch?
Die lösen Probleme, die sie selbst schaffen. Ungefähr so geil wie Google es seit Jahren präsentiert, dass ihr Google Now Pizza bestellen kann mit Sprache. Kam nirgends an, würde hier eh keiner der Italiener verstehen und tatsächlich gibt es seit mehr als 20 Jahren Onlinebestellung. Keine direkte API, aber braucht es alles nicht.
Interessanter wäre ein WordPress Plugin um die ganze KI Crawler zu blocken. Die ziehen sich nämlich alles von der Seite und führen alles aus – außer die robots.txt. Bei manchen macht KI Crawler schon 3/4 des Traffics aus. Totaler Wahnsinn. Man muss ständig ganze Subnetze sperren, oder Inhalte nur für eingeloggte Nutzer sichtbar machen.
Auf jeden Fall machen die das Internet kaputt.
Frag doch einfach mal, wenn du nicht verstehst – Noch bevor du urteilst.
Du bist nicht der einzige der so denkt
https://en.wikipedia.org/wiki/Dead_Internet_theory
Über die „ich bin kein Roboter“ Frage werden sie es allerdings nicht hinaus schaffen oder hat man der KI nun Lügen beigebracht:-O