OpenAI GPT-4o: Neues, generatives KI-Modell vorgestellt

OpenAI hat ein neues, generatives KI-Modell namens GPT-4o eingeführt, welches die KI-Fähigkeiten des Unternehmens sowohl für Entwickler als auch für Endverbraucherprodukte im Laufe der nächsten Wochen erheblich verbessern soll. Das „o“ in GPT-4 steht im Übrigen für „omni“. Zahlreiche Beispiele vom neuen Modell gibt es in der Ankündigung zu erleben.

Der CTO von OpenAI, Mira Murati erläuterte im Stream, dass das neue Modell die Intelligenz von GPT-4 beibehält, aber die Fähigkeiten über Text, Vision und sogar Audio erweitert. GPT-4o agiert und erkennt in Sprache, Text und Bild, was für die Interaktion zwischen Menschen und Maschinen natürlich sehr wertvoll ist. Im Gegensatz zu GPT-4 Turbo, der bisher führenden Version, die sowohl Bilder als auch Text analysieren konnte, fügt GPT-4o also auch Spracherkennung hinzu. GPT-4o soll in der Lage sein, emotionale Stimmung in der Stimme eines Benutzers zu erkennen und darauf zu reagieren.

OpenAI verbessert damit aber auch ChatGPTs visuelle Fähigkeiten. Auf Anhieb kann es Fragen zu einem Foto oder einem Desktop-Bildschirm beantworten, etwa was in einer Software passiert oder welche Marke das Smartphone einer Person ist. Das Unternehmen verspricht, dass GPT-4o in 50 verschiedenen Sprachen besser funktionieren soll. In der OpenAI-API sei das neue Modell doppelt so schnell wie GPT-4 (speziell GPT-4 Turbo), kostet die Hälfte und hat höhere Geschwindigkeitsbegrenzungen. Zusätzlich zu GPT-4o wird OpenAI auch eine Desktop-Version von ChatGPT und ein erneuertes UI einführen. Aufgepasst: Die Mac-App wird zuerst erscheinen, die Windows-Version später folgen.

GPT-4os Text- und Bildfunktionen werden heute in ChatGPT eingeführt. Man stellt GPT-4o im Free-Tarif zur Verfügung und für Plus-Benutzer mit bis zu 5x höheren Nachrichtenlimits. In den kommenden Wochen werde man eine neue Version des Voice Mode mit GPT-4o im Alpha-Status innerhalb von ChatGPT Plus einführen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Nordlicht, Ehemann und Vater. Technik-verliebt und lebt fürs Bloggen. Außerdem: Mail: benjamin@caschys.blog / Mastodon

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

24 Kommentare

  1. Nette Updates, aber

    „nur“ 5x höhere Nachrichtenlimits und ansonsten nur den neuen Voice-Mode als Plus-Tarif finde ich zu wenig Mehrwert,
    Bin gespannt wie viele ihr GPT-Plus kündigen werden oder wie sie die 20€ im Monat künftig rechtfertigen.
    Persönlich werde ich in der Free-Version + API bei Bedarf günstiger fahren.
    Zumindest so lange bis GPT 5 den Plus-Usern vorbehalten ist 🙂

    • Wir wissen nicht die Baseline von der wir die 5x hochrechnen könnten. VOICE Mode gibt es für die Plus User in Alpha, später für den Rest kostenlos.

  2. ChatGPT unterstützt mich so dermaßen in meiner Arbeit, dass ich sogar 200 Euro im Monat zahlen würde.

    • Was machst du?
      Hab ChatGPT in der Arbeit nur für Meeting Minutes bisher genutzt und da ist es absolut unbrauchbar.

    • Das stimmt, ich greife auch sehr oft auf ChatGPT zurück, wenn mir das Copilot-Ergebnis nicht passt. Unser Assistent auf GPT4-T API Basis hat leider keine History, den EU-Richtlinien sei dank… *facepalm*.

    • Was machst du beruflich?

    • Da würde ich mir Sorgen machen, dass das Unternehmen die 20 Euro bezahlt. Wenn es in großen Umfang Deine Arbeitsaufgaben unterstützt, braucht man die Komponente vor dem Bildschirm vielleicht irgendwann nicht mehr.

      • MoshPitches says:

        Vielleicht ist er freiberuflicher Softwareentwickler und lässt sich banale und stupide Methoden programmieren. Oder er hat einen eigenen Online-Shop und ChatGPT übernimmt die Werbetexte. Oder ist er Autor und ChatGPT übernimmt das Lektorat.
        Gäbe einige Bereiche, in denen ChatGPT ihn unterstützen kann, ohne dass er festangestellt ist und der Arbeitgeber ihn komplett durch ChatGPT ersetzt.

  3. SerperToni says:

    Wurde nicht eine Suchmaschine und der Angriff auf Google erwartet?
    Etwas außergewöhnliches? Für mich ist das nur ein weiteres Update. Langweilig

    • und eine Suchmaschine ist spannend ? also die angekündigten Updates sind wie Altmann es gesagt hat, Magie.
      einfach Mal auf deren homepage gehen und alles durchlesen.
      hier steht nicht mal die Hälfte der Informationen, nur das was im Stream gesagt wurde

      • Magie? Letztendlich eigentlich keine neuen Features. Man hat nur die Verarbeitungsgeschwindigkeit beo Speech2Text und Text2Speech-Konvertierung und der Video-/Bilderkennung verringert.
        Ich persönlich würde eine Kombination aus LLM und Suchmaschine erheblich spannender finden. Eventuell reduziert es die Halluzinationen.
        Derzeit ist ChatGPT nicht einmal für die Übersetzung von Speisekarten zu verwenden: Da werden bei Gerichten Zutaten verschluckt und vollkommen neue Nummerierungen erfunden. Eine Bestellung auf dieser Basis wäre sehr lustig.

        • wie gesagt, bitte erstmal ganz informieren.
          ich finde 3d rendering, gleichbleibende Figuren in einer Bilderreihe, transkribieren mit verschiedenen stimmen etc extrem beeindruckend. Im Stream wurde nur das unspannenste vorgestellt.
          ai die als Suchmaschine dient gibt’s schon, wäre nichts besonderes für mich

          • Und die Erstellung von korrekten Texten in Bildern nicht vergessen.

            • stimmt, was besonders „magisch“ war, in Schreibschrift.
              jetzt müssen nur noch die Tokens wie bei Gemini auf 1 million hoch und die Konkurrenz kommt ins straucheln

  4. Hans Müller says:

    Finde ich so uninteressant, ich hab die Meldung nur überflogen. OpenAI ist definitiv keine schlechte Firma, aber für mich ist der nächste Schritt die lokale AI Instanz, ich hab weder Lust noch Geld für 20€/ Monat für einen Pro Account bei OpenAI/MS oder sonst wem. Ich stecke das Geld lieber in eine stärke GPU oder einen neuen Prozessor mit AI Beschleuniger – das meine Daten privat bleiben und nicht zum trainieren der AI benutzt, ist mir auch wichtig.

    • Sparbrötchen says:

      Für Mac/Linux/WIndows bietet https://ollama.com/ per Installer lokal Llama 3, Phi 3, Mistral, Gemma etc.

    • Hardware die für sowas wie ChatGPT 4 notwendig ist, kann sich kaum einer privat leisten. Ein KI-Server mit 8 A100 Karten kostet um 200.000€. Das ist nicht mit so einer super billigen 1500€ Gamer-Karte getan, sie hat bei weitem nicht genug Speicher.

  5. Sollte heute eigentlich nicht GPT-4o für alle freigeschaltet werden? In der App ist irgendwie noch nichts davon zu sehen. Oder ist nur USA gemeint?

  6. Wie macht der CTO das ? Also diesen Chat mit der KI. Braucht es dazu ein neues Programm oder wie funktioniert es ? Er hat seine Kamera an, die auf ihn gerichtet ist (also Selfie Modus) und spricht und sie antwortet ihm. Ich habe keine Idee wie ich das machen könnte. Weiß jemand Rat ?

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.