DeepSeek stellt neue KI-Modelle für besseres Reasoning vor

von Olli Jan. 21, 2025 | 9 Kommentare

DeepSeek hat zwei neue KI-Modelle vorgestellt, die besonders beim logischen Denken und Schlussfolgern neue Maßstäbe setzen sollen: DeepSeek-R1-Zero und DeepSeek-R1.

Das Besondere an DeepSeek-R1-Zero ist der Trainingsansatz: Das Modell wurde ausschließlich durch Reinforcement Learning (RL) trainiert, ohne vorheriges überwachtes Training. Diese Methode zeigt, dass KI-Modelle auch ohne menschliche Vorgaben Reasoning-Fähigkeiten entwickeln können.

? DeepSeek-R1 is here!

? Performance on par with OpenAI-o1
? Fully open-source model & technical report
? MIT licensed: Distill & commercialize freely!

? Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

? 1/n pic.twitter.com/7BlpWAPu6y

— DeepSeek (@deepseek_ai) January 20, 2025

Allerdings zeigte R1-Zero auch Schwächen, wie endlose Wiederholungen und Sprachmischungen. Die verbesserte Version DeepSeek-R1 nutzt daher zusätzlich initiale Trainingsdaten und erreicht damit Leistungen auf Augenhöhe mit OpenAIs-Modellen bei Mathematik, Programmierung und logischem Denken.

Besonders interessant: DeepSeek hat auch sechs kompaktere Modelle veröffentlicht, die das Wissen der großen Modelle durch Destillation übernehmen. Das 32B-Modell übertrifft dabei sogar OpenAI-o1-mini in verschiedenen Benchmarks.

DeepSeek's first-generation reasoning models are achieving performance comparable to OpenAI's o1 across math, code, and reasoning tasks!

Give it a try! ?

7B distilled:
ollama run deepseek-r1:7b

More distilled sizes are available. ? pic.twitter.com/FdF1U3qvev

— ollama (@ollama) January 20, 2025

Alle Modelle sind Open Source und können sowohl über die DeepSeek-Plattform als auch lokal genutzt werden. Sicherlich interessant für all diejenigen, die Zuhause Anwendungsfälle für KI und die entsprechende Hardware da haben.

#	Produkt	Preis
1	Anker SoundCore 2 Bluetooth Lautsprecher, Fantastischer Sound, Enormer Bass mit Dualen...	29,99 EUR	Bei Amazon ansehen
2	Anker Nano 65W USB C Ladegerät, 3-Port PPS Schnellladegerät, iPad Ladegerät, Kompaktes Netzteil...	41,26 EUR	Bei Amazon ansehen
3	Anker Laptop Powerbank, 25000mAh 165W USB-C, 3X 100W USB-C Ports für Multi-Geräte-Ladeleistung,...	84,99 EUR	Bei Amazon ansehen

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Olli

Hauptberuflich im SAP-Geschäft tätig und treibt gerne Menschen an. Behauptet von sich den Spagat zwischen Familie, Arbeit und dem Interesse für Gadgets und Co. zu meistern. Hat ein Faible für Technik im Allgemeinen. Auch zu finden bei X (Twitter), Threads, Instagram, XING und Linkedin, per Website oder via Mail

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Markus says:
21. Januar 2025 um 09:41 Uhr

Dass sie an alle Größen denken freut mich am meisten. Für die meiste Automatisierung oder einen KI-Assistenten würde wohl ein 1.5 bis 8b Modell reichen und die laufen ja wirklich auf fast auf allen Geräten lokal. Selbst 14b geht gerade noch auf einem Mac Mini Basismodell. Gibt langsam echt keinen Grund mehr, warum Assistenten wie Siri noch so schlecht sind.
- ErikX says:
  21. Januar 2025 um 17:05 Uhr
  
  Hatte eben mal Zeit damit rumzuspielen und das Reasoning des 14b-Modells ist schon recht gut aber das Ergebnis auf Basis des Reasonings ist eher mau sobald man Englisch verlässt. Hier scheint es noch massiv Probleme mit der jew. Sprache zu geben. Im Reasoning kommt sowieso nur Englisch, was erwartbar war, aber dann wird es wild gemixt: erhalte teilweise deutsch-englisch-russisch-chinesische Antworten auf eine deutsche Frage 🙂
  
  Auf Englisch aber alles perfekt. Naja, vermutlich ist das 8b-Modell auf LLama-Basis anstatt der Qwen-Basis hier auch besser.
  
  Aber es ist sau-lahm, 10-13 token/s auf einem M1 Pro mit 16GB, klar, nicht so dolle dafür geeignet 🙂
  
  Ich muss mal das 1.5B ausgiebig testen. Ist jedenfalls deutlich performanter mit 70 token/s und BoundaryML funktioniert wohl auch sehr gut… hätte da so einige Ideen bzgl. Automatisierung.
Ted says:
21. Januar 2025 um 13:54 Uhr

Es gibt verschiedene Warnungen zu Modellen von diesem Hersteller:
https://www.linkedin.com/posts/reuvencohen_im-gonna-say-this-because-no-one-else-activity-7280365184135700480-IkBU/

https://thehackernews.com/2024/12/researchers-uncover-prompt-injection.html?m=1
- ErikX says:
  21. Januar 2025 um 15:43 Uhr
  
  Ah, wieder ein NATO-Troll bzw. Bot mit der üblichen Anti-Chinesischen Propaganda. Na, wie ist das Wetter in Riga beim NATO Zentrum für Strategische Kommunikation, aka Trollfabrik?
  
  Und übrigens: Dein erster Link ist pure Verschwörungstheorie und träfe genau so ebenso auf alle anderen Modelle zu (siehe Anstrengungen zum Thema Alignment).
  
  Dein zweiter Link ist lediglich eine potentielle Lücke im Chatbot welche offenbar auch genau so bei Claude zu finden war. Mit dem Modell hat es nichts zu tun.
  - Ted says:
    21. Januar 2025 um 17:29 Uhr
    
    Gähn, habe nicht behauptet, dass andere Modelle keine Probleme hätten. Aber in diesem Artikel geht es nunmal um DeepSeek. Mein Post war eine reine Sachinformation…kann man alles auch selbst überprüfen und sich eine eigene Meinung bilden. Niemand hindert Dich dran, die Dinger zum Programmieren zu verwenden oder nach Tian’anmen zu fragen.
    (Der Ton hier wird auch immer aggro-politischer…warum nur?)
    - ErikX says:
      21. Januar 2025 um 18:27 Uhr
      
      „Mein Post war eine reine Sachinformation“
      
      Nein, der Link ist keine Sachinformation und ihm fehlen jegliche Belege – es ist das typische „China is bad“-Geraune. Siehe auch Kommentare drunter. Und der zweite Link hat nichts mit dem Modell zu tun.
      
      „Der Ton hier wird auch immer aggro-politischer…warum nur?“
      
      Ich passe mich nur an denn ich habe gelernt, dass man so heutzutage miteinander umgeht: einfach das Gegenüber als XYZ-Troll bezeichnen, abwerten, ausgrenzen, fertig. So einfach kann die Welt sein! 🙂
      - Ted says:
        21. Januar 2025 um 19:58 Uhr
        
        Das Problem Deines Posts ist, das er nicht in Ordnung ist. „Es gibt Warnungen.“ ist eine Sachinformation. Ob diesen zu trauen ist, kann jeder selbst entscheiden. Auch Du!
        
        Aber Dein Ton ist nicht in Ordnung! Erst einen Poster in eine ideologische Ecke stellen, dann die Information anzweifeln, danach dann mit What-Aboutism ablenken. Und das Ganze schaffst Du, ohne auch nur auf einen einzigen inhaltlichen Kritikpunkt der verlinkten Informationen einzugehen.
        
        Integer says:
        21. Januar 2025 um 21:49 Uhr
        
        Das macht er auf anderen Plattformen auch @Ted, mach dir nichts draus. Er ist halt ein AfD-Wähler und hat starke kognitive Schwierigkeiten, auch bzgl. von Zusammenhängen erkennen
Patrick says:
24. Januar 2025 um 09:04 Uhr

mich interessieren politische Fragen 🙂

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.

DeepSeek stellt neue KI-Modelle für besseres Reasoning vor

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Neueste Beiträge

9 Kommentare

Umfrage des Monats

Diese Woche beliebt