Mistral hat am 23. Juni OCR 4 veröffentlicht, ein Modell, das aus Dokumenten nicht nur sauberen Text zieht, sondern gleich die Struktur mitliefert. Zu jedem Block gibt es eine Bounding Box, eine Typ-Klassifizierung (Titel, Tabelle, Formel, Unterschrift) und einen Konfidenzwert pro Seite und pro Wort. Das Modell unterstützt 170 Sprachen, akzeptiert PDF, DOC, PPT und OpenDocument und passt in einen einzigen Container. Genau dieser letzte Punkt ist der eigentliche Verkaufstext.
Denn OCR 4 lässt sich vollständig selbst hosten. Die Dokumente verlassen die eigene Infrastruktur nicht, was für alle interessant ist, die sensible Akten nicht durch eine fremde Cloud-API schicken dürfen oder wollen. In einer blinden menschlichen Bewertung über 600 Dokumente in mehr als zwölf Sprachen bevorzugten unabhängige Tester die Ausgabe von OCR 4 in 72% der Fälle gegenüber jedem getesteten Konkurrenzsystem. Über die API kostet das Ganze 4 Dollar pro 1.000 Seiten, im Batch-Modus 2 Dollar.
Für KI-Nutzer in regulierten Bereichen wie Recht, Finanzen oder Gesundheit ist das der relevante Teil. Wer bisher zwischen brauchbarer Texterkennung und Datenschutz wählen musste, bekommt hier beides im selben Paket. Die strukturierte Ausgabe ist außerdem als Futter für RAG-Pipelines und Agenten gedacht, die Formulare ausfüllen, Rechnungen verarbeiten oder Compliance-Checks fahren sollen. Wer schon einmal überlegt hat, KI im eigenen Haus statt in der Cloud laufen zu lassen, findet hier ein weiteres Argument dafür. Mehr dazu, was lokal überhaupt geht, steht in unserem Überblick zur eigenen KI auf dem Rechner.
Eine Einschränkung liefert Mistral selbst gleich mit, und das ist ungewöhnlich ehrlich. Die Benchmarks seien »directional«, also nur als Richtungsangabe zu verstehen, man solle besser auf den eigenen Dokumenten testen. Außerdem ist OCR 4 ausdrücklich kein Entscheider: keine Diagnosen, keine Rechtsgutachten, keine Finanzentscheidungen. Es liest, es sortiert, es bewertet seine eigene Sicherheit. Was am Ende mit den extrahierten Daten passiert, bleibt weiterhin Aufgabe des Menschen, und das ist bei dem Thema auch besser so. Wer wissen will, wie sich der Datenschutz bei KI-Diensten grundsätzlich regeln lässt, liest dort weiter.
Quellen
- Mistral AI: Introducing OCR 4
- VentureBeat: Mistral launches OCR 4, turning document extraction into a full enterprise AI play
- Microsoft Community Hub: Mistral Document AI with OCR 4 arrives in Microsoft Foundry
Ähnliche News
- Claude Design baut jetzt brav nach deinem Designsystem
- OpenAI lässt neue Modelle deine alten Chats nachspielen
- Gemini übersetzt jetzt live ins Ohr, in über 70 Sprachen
Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.