DeepSeek R1: Hugging Face will KI-Modell nachbauen

Kaum hat DeepSeek sein R1 „Reasoning“-KI-Modell veröffentlicht, gibt es schon spannende Neuigkeiten aus dem Hause Hugging Face. Das Forschungsteam dort hat sich nämlich ein interessantes Projekt vorgenommen: Sie wollen R1 komplett nachbauen – und zwar komplett Open Source.

Leandro von Werra, der Forschungsleiter bei Hugging Face, hat zusammen mit seinem Team das „Open-R1“-Projekt ins Leben gerufen. Der Grund dafür ist nachvollziehbar: Zwar ist DeepSeeks R1-Modell technisch gesehen „offen“, da es unter einer permissiven Lizenz steht. Allerdings fehlt die echte Transparenz, denn die verwendeten Tools und Trainingsmethoden bleiben im Dunkeln – wie so oft in der KI-Branche.

Eine permissive Lizenz ist eine Art von Open-Source-Softwarelizenz, die den Nutzern große Freiheit bei der Verwendung, Modifikation und Verbreitung der Software gewährt. Diese Lizenzen sind in der Regel weniger restriktiv als andere Open-Source-Lizenzen, wie zum Beispiel die GNU General Public License (GPL).

Das Hugging Face Team will nun nicht nur das Modell nachbauen, sondern auch alle Trainingsdaten und Zwischenschritte öffentlich machen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Nordlicht, Ehemann und Vater. Technik-verliebt und lebt fürs Bloggen. Außerdem: Mail: benjamin@caschys.blog / Mastodon

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

2 Kommentare

  1. Das wird dann vermutlich den Nachteil haben, dass das Modell deutlich schlechter wird, weil die Traningsdaten geringer sein werden – Urheberrecht lässt grüßen.

    • FriedeFreudeEierkuchen says:

      Manche vermuten derzeit, dass deepseek mit Hilfe von ChatGPT trainiert wurde.Es könnte daher auch heraus kommen, dass das Modell ohne vortrainierten Lernkörper gar nicht funktioniert. Das würde einige an der Börse sehr beruhigen 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.