Mistral OCR 4: Dokumentenextraktion mit Self-Hosting-Option
Mistral OCR 4: strukturierte Extraktion in 170 Sprachen, self-hostbar für Enterprise. Was es kann, was es kostet und wo die Souveränität endet.
Das französische KI-Unternehmen Mistral hat am 23. Juni 2026 OCR 4 vorgestellt, ein Modell, das Dokumente nicht nur in Text umwandelt, sondern strukturiert ausliest. Für Teams, die Rechnungen, Verträge, Formulare oder Akten verarbeiten, ist das interessant, vor allem wegen eines Details: Es lässt sich auf eigener Infrastruktur betreiben. Genau hier lohnt aber der zweite Blick, denn "europäisch und self-hostbar" heißt nicht automatisch "frei wie ein lokales Modell".
Was OCR 4 kann
Klassisches OCR liefert eine Wand aus Text. OCR 4 gibt stattdessen Struktur zurück:
- Bounding Boxes auf Absatz-Ebene, also die Koordinaten, wo ein Textblock im Dokument steht
- Typisierte Blöcke, die zwischen Überschrift, Fließtext, Tabelle und ähnlichem unterscheiden
- Confidence Scores pro Block, damit ihr seht, wo das Modell sich sicher ist und wo nicht
- 170 Sprachen, was für Dokumente aus mehrsprachigen Lieferketten oder Behörden relevant ist
Diese strukturierte Ausgabe ist der eigentliche Punkt. Sie lässt sich direkt in RAG-Pipelines, Agenten-Workflows oder eine Enterprise-Suche stecken, ohne dass ihr den Rohtext erst mühsam nachbearbeiten müsst. Mistral selbst gibt eine durchschnittliche Win-Rate von 72 Prozent gegen führende OCR- und Dokumenten-Systeme an und einen Spitzenwert auf dem OlmOCRBench (85,20). Wie bei allen Hersteller-Benchmarks gilt: am eigenen Dokumentenbestand testen, nicht auf die Zahl verlassen.
Was es kostet
Über die API ist die Abrechnung seitenbasiert:
| Variante | Preis |
|---|---|
| OCR 4 (API) | 4 $ pro 1.000 Seiten |
| OCR 4 (Batch-API) | 2 $ pro 1.000 Seiten |
| Document AI | 5 $ pro 1.000 Seiten |
Für gelegentliche Extraktion ist das günstig. Bei hohen Volumina lohnt der Batch-Modus mit dem halben Preis.
Self-hostbar, aber nicht frei
Hier liegt der Punkt, der leicht untergeht. OCR 4 ist kein Open-Weight-Modell. Es gibt keine offenen Gewichte zum Download auf Hugging Face, der Zugang läuft über die API (Mistral Studio, Amazon SageMaker, Microsoft Foundry, Snowflake folgt).
Das Self-Hosting existiert, ist aber an Bedingungen geknüpft: Mistral bietet "self-managed deployment" als kompakten Container an, der auf eurer eigenen Infrastruktur läuft, sodass die Dokumente das Haus nicht verlassen. Verfügbar ist das aber nur für Enterprise-Kunden auf Anfrage, also gegen eine kommerzielle Lizenz, deren Preis nicht öffentlich ist.
Der Unterschied ist für die DACH-Zielgruppe wichtig: Bei einem echten Open-Weight-Modell wie Ollama-Modellen, Gemma oder Qwen zahlt ihr beim Self-Hosting nur eure eigene Hardware. Bei OCR 4 zahlt ihr auch self-hosted eine Lizenzgebühr an Mistral. Die Datensouveränität bekommt ihr (die Dokumente bleiben lokal), die Kostenfreiheit und Unabhängigkeit eines offenen Modells nicht.
Was das praktisch heißt
Für Teams mit sensiblen Dokumenten und echtem Volumen ist OCR 4 eine ernstzunehmende, europäische Option: ein Anbieter unter EU-Recht, die Möglichkeit, die Verarbeitung im eigenen Haus zu halten, und eine strukturierte Ausgabe, die direkt weiterverwendbar ist. Das ist ein anderer Datenschutz-Ausgangspunkt als bei US-Cloud-OCR.
Wer aber Datensparsamkeit und Kostenkontrolle über echte Open-Source-Modelle sucht, sollte die Lizenzfrage vorab klären, bevor das Wort "self-hostbar" zu Erwartungen führt, die das Enterprise-Modell nicht erfüllt. Für die Einordnung, wann sich europäische und lokale Lösungen lohnen, hilft Digitale Souveränität für KI-Teams.
Quellen3
- Mistral: OCR 4, SOTA OCR for Document Intelligencemistral.ai
- VentureBeat: Mistral launches OCR 4, turning document extraction into a full enterprise AI playventurebeat.com
- MarkTechPost: Mistral OCR 4 brings citation-ready structured output to RAG, agentic and enterprise search pipelinesmarktechpost.com