DeepSeek stellt neue KI-Modelle für besseres Reasoning vor

DeepSeek hat zwei neue KI-Modelle vorgestellt, die besonders beim logischen Denken und Schlussfolgern neue Maßstäbe setzen sollen: DeepSeek-R1-Zero und DeepSeek-R1.

Das Besondere an DeepSeek-R1-Zero ist der Trainingsansatz: Das Modell wurde ausschließlich durch Reinforcement Learning (RL) trainiert, ohne vorheriges überwachtes Training. Diese Methode zeigt, dass KI-Modelle auch ohne menschliche Vorgaben Reasoning-Fähigkeiten entwickeln können.

Allerdings zeigte R1-Zero auch Schwächen, wie endlose Wiederholungen und Sprachmischungen. Die verbesserte Version DeepSeek-R1 nutzt daher zusätzlich initiale Trainingsdaten und erreicht damit Leistungen auf Augenhöhe mit OpenAIs-Modellen bei Mathematik, Programmierung und logischem Denken.

Besonders interessant: DeepSeek hat auch sechs kompaktere Modelle veröffentlicht, die das Wissen der großen Modelle durch Destillation übernehmen. Das 32B-Modell übertrifft dabei sogar OpenAI-o1-mini in verschiedenen Benchmarks.

Alle Modelle sind Open Source und können sowohl über die DeepSeek-Plattform als auch lokal genutzt werden. Sicherlich interessant für all diejenigen, die Zuhause Anwendungsfälle für KI und die entsprechende Hardware da haben.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hauptberuflich im SAP-Geschäft tätig und treibt gerne Menschen an. Behauptet von sich den Spagat zwischen Familie, Arbeit und dem Interesse für Gadgets und Co. zu meistern. Hat ein Faible für Technik im Allgemeinen. Auch zu finden bei Twitter, Instagram, XING und Linkedin, oder via Mail

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Ein Kommentar

  1. Dass sie an alle Größen denken freut mich am meisten. Für die meiste Automatisierung oder einen KI-Assistenten würde wohl ein 1.5 bis 8b Modell reichen und die laufen ja wirklich auf fast auf allen Geräten lokal. Selbst 14b geht gerade noch auf einem Mac Mini Basismodell. Gibt langsam echt keinen Grund mehr, warum Assistenten wie Siri noch so schlecht sind.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.