Mistral OCR 3: Neues Modell für Texterkennung und Dokumentenverarbeitung


Mistral hat mit OCR 3 ein neues Modell zur Texterkennung veröffentlicht, das den Vorgänger in Sachen Genauigkeit und Effizienz ablösen soll. Der Fokus liegt dabei auf einer verbesserten Erfassung von Handschriften, komplexen Tabellen und gescannten Dokumenten. Laut den Entwicklern erreicht das neue Modell eine Erfolgsquote von 74 Prozent gegenüber Mistral OCR 2, wenn es um die Verarbeitung von Formularen und schwierigen Layouts geht. Die Demos sind schon recht beeindruckend.

Das Modell ist darauf ausgelegt, Text und eingebettete Bilder aus Dokumenten zu extrahieren und in Markdown auszugeben. Eine Besonderheit ist die Rekonstruktion von Tabellen. OCR 3 erkennt Header, verbundene Zellen und Spaltenstrukturen und gibt diese als HTML-Tags aus, damit die ursprüngliche Formatierung erhalten bleibt. Auch Handschriften, egal ob kursiv oder als Notiz auf einem gedruckten Formular, sollen zuverlässiger erkannt werden.

Wer das ausprobieren möchte, findet im Mistral AI Studio nun den Document AI Playground. Dort lassen sich PDFs oder Bilder per Drag-and-Drop hochladen und direkt in sauberen Text oder strukturiertes JSON umwandeln. Entwickler können das Modell unter der Kennung mistral-ocr-2512 über die API ansprechen.

Preislich positioniert sich Mistral aggressiv. Für 1.000 Seiten werden 2 Dollar fällig. Nutzt man die Batch-API, gibt es einen Rabatt von 50 Prozent, was den Preis auf 1 Dollar pro 1.000 Seiten drückt. Das Modell ist ab sofort verfügbar und vollständig abwärtskompatibel zum Vorgänger. Einsatzgebiete sind vor allem die Digitalisierung von Archiven, das Auslesen von Rechnungen oder die Verarbeitung technischer Berichte.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Gefällt dir der Artikel? Dann teile ihn mit deinen Freunden.

Avatar-Foto

Hallo, ich bin Carsten! Ich bin gelernter IT-Systemelektroniker und habe das Blog 2005 gegründet. Baujahr 1977, Dortmunder im Norden, BVB-Fan und Vater eines Sohnes. Auch zu finden bei X, Threads, Facebook, LinkedIn und Instagram.

Neueste Beiträge

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Es werden alle Kommentare moderiert. Lies auch bitte unsere Kommentarregeln:

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen. Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte - gerne auch mit Humor. In jedes Thema Politik einbringen ist nicht erwünscht. Es besteht kein Recht auf die Veröffentlichung eines Kommentars.

Du willst nichts verpassen?

Du hast die Möglichkeit, den Kommentar-Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den Hauptfeed abonnieren.