Grok 4.1: xAIs neues Modell startet für alle Nutzer

xAI legt nach: Grok 4.1 ist freigeschaltet und steht direkt auf grok.com, in der X-Oberfläche und in den Apps für iOS und Android bereit. Im Auto-Modus läuft das neue Modell bereits an, im Modell-Auswahlmenü lässt sich Grok 4.1 auch direkt auswählen. Kein großes Tam-Tam, eher ein ruhiger Start, aber mit klarer Ansage: Mehr Alltagstauglichkeit, weniger Fehler, dazu ein Modell, das im Umgang mit Menschen runder wirken soll.

Unter der Haube bleibt es klassisch KI-schwergewichtig. xAI nutzt die gleiche Infrastruktur für Reinforcement Learning wie schon bei Grok 4 und dreht diesmal laut der Entwickler gezielt an Stellschrauben wie Stil, Persönlichkeit, Hilfsbereitschaft und Ausrichtung des Modells. Um diese eher schwer messbaren Ziele zu optimieren, kommen sogenannte Reward-Modelle zum Einsatz, die Antworten automatisiert bewerten und in großem Stil Rückmeldungen geben. Laut xAI steckt hier Agent-Logik der neuesten Generation dahinter, die das Modell beim Feinschliff anleitet.

Bei LMArena, einer Art Text-Arena mit Elo-Wertung, taucht Grok 4.1 in zwei Varianten auf. Die „Thinking“-Variante mit expliziter Reasoning-Phase (Codename „quasarflux“) liegt dort mit 1.483 Elo auf Platz eins. Direkt dahinter das schnelle Grok 4.1 ohne Thinking-Token (Codename „tensor“) mit 1.465 Elo. Laut Ranking schlägt Grok 4.1 ohne Reasoning damit die voll auf Denken ausgelegten Modi anderer Anbieter. Das alte Grok 4 tauchte in der gleichen Liste noch auf Rang 33 auf. Muss man wohl alles für sich selbst und seine Anwendungsfälle testen.

Im Blogpost zeigt xAI ein Beispiel: Eine Person vermisst ihre Katze, die Antworten von Vorgänger und Grok 4.1 stehen nebeneinander. Grok 4.1 spricht direkter, greift Bilder aus dem Alltag auf und benennt das Gefühl klarer. Der Text wirkt weniger wie ein Standard-Trostspruch aus der Schublade, sondern eher wie eine Nachricht, die auch so in einem Chat zwischen zwei Menschen landen könnte. Genau in diese Richtung will xAI das Modell schieben. Erinnert mich ein bisschen an die Aussagen, die OpenAI bei ChatGPT 5.1 traf.

Technisch bleibt Grok 4.1 ein geschlossenes System, tiefe Einblicke in Parameteranzahl oder Trainingsdaten gibt es nicht. xAI konzentriert sich auf Benchmarks und Beispiele. Klar ist: Es gibt zwei klar getrennte Modi, Thinking und Non-Reasoning. Die Thinking-Variante nimmt sich mehr Zeit, nutzt interne „Denk-Token“ und zielt auf maximale Qualität und Stabilität. Die schnelle Variante antwortet direkt, greift aber weiterhin auf Websuche und Tools zurück. Auf X und in den Apps übernimmt Auto-Mode im Hintergrund die Auswahl, wann welcher Modus sinnvoll ist, ohne dass jedes Mal manuell umgestellt werden muss.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

15 Kommentare

  1. psst, streng vertraulich

    Grok bietet von allen KI Modellen mit Abstand die ausführlichsten und besten Zusammenfassungen von Artikeln, die hinter einer Paywall sind.

    wird sowieso spannend, wie Paywalls sich in Zeiten von KI in den nächsten Jahren verändern

    • Es gibt durchaus andere Möglichkeiten, Seiten hinter einer Paywall zu erreichen. Und „erreichen“ heißt dann sogar „selber lesen“, und nicht von einer Schwachmaten-KI zusammenfassen lassen. 🙂

      • Also ich bemühe ebenfalls die KI dafür.
        Denn mir ist nicht bekannt wie das sonst funktionieren soll.

      • Skynet und der Musk Overlord … fanboys und hater heutzutage im Netz.

      • Nicht jeder kennt die archive.ph-Seiten (u. a. Endungen).
        Ohne Beleidigung ging’s wohl nicht, wieso sind KI-Nutzer pauschal Schwachmaten?

        • Ähm, wo habe ich geschrieben, dass KI-Nutzer Schwachmaten sind? Bitte meinen zweiten Satz nochmal GENAU lesen UND verstehen!

          Wenn Letzteres nicht klappt, dann ist das möglicherweise ja schon eine Auswirkung davon, dass man nur noch KI-Zusammenfassungen liest… 😉 Das macht Diejenigen, die das tun, natürlich immer noch nicht zu Schwachmaten. NOCH nicht zumindest… 😀

    • Ich nutze Grok nur zum Zusammensuchen von Infos (Gerüchte etc) aus Twitter-Posts.
      Vorhin wieder wollte Grok mir weißmachen dass das Apple Vision Pro M5 nicht erschienen sei sondern sich die Gerüchte nicht bewahrheitet hätten. Auch nach einem Hinweis blieb es dabei.
      Scheint eher schlechter geworden zu sein als besser.

      Das ist jetzt mal ganz davon losgelöst dass das ganz Model mit starkem politischen Einschlag versehen wird.

      • „ Das ist jetzt mal ganz davon losgelöst dass das ganz Model mit starkem politischen Einschlag versehen wird“. Wie kommst du darauf? Weil Musk die Zensur herunterfährt entsteht ein politischer Einschlag? Könnte falscher nicht sein. Mit keiner KI kann man so frei und ausgewogen „diskutieren“, wie mit Grok.

  2. Ja, das Beispiel aus dem Blogpost mit der Katze hat bei mir sehr gut funktioniert und „ungewollte“ Erinnerungen hervorgerufen.

  3. also über die API ist da noch nichts verfügbar

  4. obwohl freiheitsliebend, habe ich mich von Grok verabschiedet. Was soll u.a. der verrückt Modus und der sexy Modus? sowas kann auf Pornoseiten aber auch dann bitte mit Altersverifizierung.

    • > aber auch dann bitte mit Altersverifizierung.

      Das ist Text haha. Nicht, dass sich noch ein 16jähriger einen dieser Baumarkt-Schundromane selbst generiert oder was. 😀

  5. ich hab mal ein wenig mit ChatGPT, Grok, Gemini, Perplexity usw gespielt und den Fokus auf Frage – Antwort gestellt und da hat Grok mit Abstand den größten Stuss erzählt.

    Momentan gefällt mir Gemini & Perplexity am besten. In der Arbeit nutze ich CoPilot

    • Mir gefällt Perplexity auch am besten
      Aber ich nutze immer Claude 4.5 das ist mega.
      Vlt ist Gemini 3 jetzt wieder besser.

  6. Da werden jetzt keine eventuellen Kosten (Abonnement o. ä.) erwähnt.?

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.