OpenAI: Multimodaler KI-Assistent könnte vorgestellt werden

OpenAI - Logo des Unternehmens

OpenAI – Logo des Unternehmens

OpenAI wird immer vieles nachgesagt, eine Suchmaschine, GPT-5 und eine Partnerschaft mit Apple. Die ersten beiden Punkte dementierte man bereits, am Montag wolle man aber etwas vorstellen.

Laut einem neuen Bericht von The Information hat OpenAI einigen seiner Kunden ein neues multimodales KI-Modell vorgestellt, das sowohl mit ihnen sprechen, als auch Objekte erkennen kann. Das soll Teil dessen sein, was das Unternehmen am Montag zeigen möchte.

Anmerkung: Multimodal bezieht sich in der Kontext von künstlicher Intelligenz (KI) auf Systeme, die mehrere Eingabetypen verarbeiten können, z.B. Text, Ton und Bild. Ein multimodales KI-System erfasst, interpretiert und kombiniert Informationen aus verschiedenen Quellen, um eine umfassendere und genauere Antwort oder Reaktion zu liefern.

Ebenfalls wurde ausgesagt, dass das neue Modell eine schnellere, genauere Interpretation von Bildern und Audio bietet als OpenAIs bestehende separate Transkriptions- und Text-zu-Sprache-Modelle.

Die neue Technik könnte angeblich Kundendienstmitarbeitern helfen, die Betonung der Stimmen der Anrufer besser zu verstehen, beispielsweise, ob der Anrufer sarkastisch oder theoretisch spricht. Ebenso sollen Schilder einfach und schnell übersetzt werden – und Mathe-Hilfe könne auch besser gegeben werden.

Der Bericht spricht davon, dass das Modell das GPT-4 Turbo bei der Beantwortung einiger Arten von Fragen übertreffen kann, aber immer noch anfällig dafür ist, Dinge selbstsicher, aber falsch zu beantworten.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

7 Kommentare

  1. Auf die Mathe-Hilfe bin ich dann mal gespannt. Habe neulich ChatGPT gefragt, wie lang die Diagonale eines DIN A4 Blattes ist: 30.1cm

    • Ich hab es gerade auch gefragt.

      import math

      # Breite und Höhe eines A4-Blattes in mm
      breite = 210
      hoehe = 297

      # Berechnung der Diagonale
      diagonale = math.sqrt(breite**2 + hoehe**2)
      diagonale

      Die Diagonale eines A4-Blattes, welches eine Standardgröße von 210 mm Breite und 297 mm Höhe hat, kann mit dem Satz des Pythagoras berechnet werden. Die Formel dafür lautet:

      \[ \text{Diagonale} = \sqrt{\text{Breite}^2 + \text{Höhe}^2} \]

      \[ \text{Diagonale} = \sqrt{210^2 + 297^2} \]

      Lassen Sie uns das berechnen.

      Die Diagonale eines A4-Blattes beträgt etwa 363,74 mm.

      Ich hab ChatGPT4 benutzt.

    • Ich habe Copilot (GPT Precise Mode) gefragt:
      Ein DIN A4 Blatt hat die Maße 210 mm x 297 mm¹. Die Länge der Diagonale eines Rechtecks kann mit dem Satz des Pythagoras berechnet werden, der besagt, dass das Quadrat der Länge der Diagonalen gleich der Summe der Quadrate der Längen der beiden Seiten ist.

      In diesem Fall können wir die Formel so anwenden:

      $$ d = \sqrt{a^2 + b^2} $$

      wobei `a` die Breite des Blattes (210 mm) und `b` die Höhe des Blattes (297 mm) ist. Wenn wir diese Werte in die Formel einsetzen, erhalten wir:

      $$ d = \sqrt{(210\,mm)^2 + (297\,mm)^2} $$

      Das ergibt eine Diagonale von etwa 365 mm oder 36,5 cm. Bitte beachten Sie, dass dies eine Näherung ist und der tatsächliche Wert je nach Genauigkeit der Messung leicht variieren kann.

    • Danke für euer Feedback. Ich hatte das kostenlose ChatGPT benutzt. Schon erstaunlich, dieser Qualitätssprung.

  2. Wäre schön, wenn man mal an Grundlegendem arbeiten würde. Gerade die Bilderstellung ist ein Krampf. Nicht einmal das, was ChatGPT im Antworttext selbst angibt wird im Bild umgesetzt. Auch die Übersetzung von PDFs ist ein Krampf. Gestern eine neun-seitige Speisekarte versucht zu übersetzen. Es kam nie ein Ergebnis. Bei Nachfragen nur die Antwort es würde erstellt oder das weiter dran gearbeitet wird. Auch ein zweiter Versuch hat nie zu einem Ergebnis geführt.
    Geschilderte Erfahrungen im Übrigen alls mit ChatGPT for Teams.

  3. Klaus Mehdorn Travolta says:

    Das sagt Gemini dazu:
    prompt: Wie lang ist die Diagonale einer DIN A4 Seite?
    antwort: Die kurze Seite eines DIN A4 Blattes ist 21 cm lang und die lange Seite 29,7 cm lang. Die Diagonale entspricht der Hypothenuse eines rechtwinkligen Dreiecks mit diesen Seitenlängen.

    Um die Diagonale zu berechnen, können wir den Satz des Pythagoras verwenden. Dieser besagt: a² + b² = c², wobei a und b die Längen der beiden Katheten (kürzere Seiten) des Dreiecks sind und c die Länge der Hypotenuse (Diagonale) darstellt.

    Einsetzen der Werte ergibt: 21² cm² + 29,7² cm² = c²

    Die Gleichung lässt sich dann lösen nach c. Wurzel (21² cm² + 29,7² cm²) ≈ 36,37 cm.

    Die Diagonale einer DIN A4 Seite beträgt also in etwa 36,37 cm.

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.