Mistral OCR 4: Dokumentenextraktion mit Self-Hosting-Option

Mistral OCR 4: strukturierte Extraktion in 170 Sprachen, self-hostbar für Enterprise. Was es kann, was es kostet und wo die Souveränität endet.

4 Min. Lesezeit

Das französische KI-Unternehmen Mistral hat am 23. Juni 2026 OCR 4 vorgestellt, ein Modell, das Dokumente nicht nur in Text umwandelt, sondern strukturiert ausliest. Für Teams, die Rechnungen, Verträge, Formulare oder Akten verarbeiten, ist das interessant, vor allem wegen eines Details: Es lässt sich auf eigener Infrastruktur betreiben. Genau hier lohnt aber der zweite Blick, denn "europäisch und self-hostbar" heißt nicht automatisch "frei wie ein lokales Modell".

Was OCR 4 kann

Klassisches OCR liefert eine Wand aus Text. OCR 4 gibt stattdessen Struktur zurück:

  • Bounding Boxes auf Absatz-Ebene, also die Koordinaten, wo ein Textblock im Dokument steht
  • Typisierte Blöcke, die zwischen Überschrift, Fließtext, Tabelle und ähnlichem unterscheiden
  • Confidence Scores pro Block, damit ihr seht, wo das Modell sich sicher ist und wo nicht
  • 170 Sprachen, was für Dokumente aus mehrsprachigen Lieferketten oder Behörden relevant ist

Diese strukturierte Ausgabe ist der eigentliche Punkt. Sie lässt sich direkt in RAG-Pipelines, Agenten-Workflows oder eine Enterprise-Suche stecken, ohne dass ihr den Rohtext erst mühsam nachbearbeiten müsst. Mistral selbst gibt eine durchschnittliche Win-Rate von 72 Prozent gegen führende OCR- und Dokumenten-Systeme an und einen Spitzenwert auf dem OlmOCRBench (85,20). Wie bei allen Hersteller-Benchmarks gilt: am eigenen Dokumentenbestand testen, nicht auf die Zahl verlassen.

Was es kostet

Über die API ist die Abrechnung seitenbasiert:

VariantePreis
OCR 4 (API)4 $ pro 1.000 Seiten
OCR 4 (Batch-API)2 $ pro 1.000 Seiten
Document AI5 $ pro 1.000 Seiten

Für gelegentliche Extraktion ist das günstig. Bei hohen Volumina lohnt der Batch-Modus mit dem halben Preis.

Self-hostbar, aber nicht frei

Hier liegt der Punkt, der leicht untergeht. OCR 4 ist kein Open-Weight-Modell. Es gibt keine offenen Gewichte zum Download auf Hugging Face, der Zugang läuft über die API (Mistral Studio, Amazon SageMaker, Microsoft Foundry, Snowflake folgt).

Das Self-Hosting existiert, ist aber an Bedingungen geknüpft: Mistral bietet "self-managed deployment" als kompakten Container an, der auf eurer eigenen Infrastruktur läuft, sodass die Dokumente das Haus nicht verlassen. Verfügbar ist das aber nur für Enterprise-Kunden auf Anfrage, also gegen eine kommerzielle Lizenz, deren Preis nicht öffentlich ist.

Der Unterschied ist für die DACH-Zielgruppe wichtig: Bei einem echten Open-Weight-Modell wie Ollama-Modellen, Gemma oder Qwen zahlt ihr beim Self-Hosting nur eure eigene Hardware. Bei OCR 4 zahlt ihr auch self-hosted eine Lizenzgebühr an Mistral. Die Datensouveränität bekommt ihr (die Dokumente bleiben lokal), die Kostenfreiheit und Unabhängigkeit eines offenen Modells nicht.

Was das praktisch heißt

Für Teams mit sensiblen Dokumenten und echtem Volumen ist OCR 4 eine ernstzunehmende, europäische Option: ein Anbieter unter EU-Recht, die Möglichkeit, die Verarbeitung im eigenen Haus zu halten, und eine strukturierte Ausgabe, die direkt weiterverwendbar ist. Das ist ein anderer Datenschutz-Ausgangspunkt als bei US-Cloud-OCR.

Wer aber Datensparsamkeit und Kostenkontrolle über echte Open-Source-Modelle sucht, sollte die Lizenzfrage vorab klären, bevor das Wort "self-hostbar" zu Erwartungen führt, die das Enterprise-Modell nicht erfüllt. Für die Einordnung, wann sich europäische und lokale Lösungen lohnen, hilft Digitale Souveränität für KI-Teams.

Quellen3