Apple: Forschungspapier zeigt ReALM

Apple hat ein Forschunspapier veröffentlicht. In ihm wird ein neues System namens ReALM (Reference Resolution As Language Modeling) vorgestellt, das Sprachassistenten, wie Siri, helfen soll, Zusammenhänge in Gesprächen besser zu verstehen. Virtuelle Assistenten müssen oft Bezüge in Gesprächen richtig deuten. Wenn wir zum Beispiel sagen „Ruf ihn an“, muss der Assistent wissen, wen wir meinen. ReALM löst solche Bezüge nun viel besser auf als bisherige Systeme. Dazu gehören auch Verweise auf dem Bildschirm. Wenn dort eine Adresse angezeigt wird und jemand sagt „Navigiere mich dorthin“, weiß ReALM, was gemeint ist. Dafür wandelt es die Adresse in Text um. So können die Sprachmodelle im Hintergrund den Bezug herstellen, ohne das Bild selbst zu verarbeiten.

In den Tests der Forscher hat sich gezeigt, dass ReALM deutlich besser funktioniert als andere Ansätze. Es erreicht sogar fast die Leistung von GPT-4, hat dabei aber wahrscheinlich deutlich weniger Parameter. Die kleinste Version von ReALM verfügt über etwa 80 Millionen Parameter. Zum Vergleich: GPT-4 wird auf über 1,8 Billionen Parameter geschätzt, die mit wahrscheinlich unzähligen Billionen Token trainiert wurden.

Damit einher kommt ReALMs größter Vorteil: Es ist so ressourcenschonend, dass es lokal auf Endgeräten laufen kann. Welche Apple-Produkte letztlich von diesem Modell profitieren werden, bleibt abzuwarten – iOS 18 soll aber das größte Update seit Langem sein, vielleicht sehen wir hier Siri 2.0.

Verbesserungspotenzial sieht die Forschungsgruppe auch noch. So lasse sich die Lokalisierung der Informationen auf dem Bildschirm mit Rastern noch genauer darstellen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Als ehrenamtlicher First-Level-Support und quasi Apple-Jünger, der gerne seine Lebenszeit in Tech-Blogs verbrennt, stehe ich auch gerne für hitzige Diskussionen zur Verfügung.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

4 Kommentare

  1. Siri hätte wirklich ein Update Nötig, nicht erst seit es Chat GPT gibt.

  2. Make Siri intelligent again!

  3. Was hat Apple vor? Seit Jahren nichts Cooles mehr von dort. Abgesehen von der Nische Vision Pro. Und nun KI. KI von Google zu holen würde keinen gute n Eindruck machen. Baidu? Auch nicht besser. War das nur Fake? Oder sollen bei Einführung einer neuen KI die Nutzer auswählen dürfen, damit die EU zufrieden ist? Realm klingt ja schonmal richtig gut!

  4. ich hoffe, auch die normalen funktionen werden zu 2.0 und nicht nur das erlebnis auf dem bildschirm wird intelligent verarbeitet.
    mein homepod braucht immer mal wieder einen anderen befehl, um tatsächlich meinen gewünschten radiosender abzuspielen.
    mal funktioniert 4 wochen lange „spiele radio SENDERNAME“
    dann spielt sie bei dem befehl plötzlich klassische musik auf spotify und es braucht „spiele radio SENDERNAME auf tune in“

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.