Mistral Forge: KI auf eigenen Daten trainieren
Mistral Forge ist eine europäische Plattform für vollständiges KI-Training auf Unternehmensdaten. Was sie bietet und warum sie für DACH relevant ist.
Was ist Mistral Forge?
Seit dem 17. März 2026 bietet das französische KI-Unternehmen Mistral mit Forge eine Enterprise-Plattform an, mit der Unternehmen eigene KI-Modelle auf ihren Daten trainieren können. Nicht nur Fine-Tuning, sondern vollständiges Pre-Training, Post-Training und Reinforcement Learning.
Das unterscheidet Forge von den meisten Alternativen: OpenAI, AWS Bedrock und Google Vertex AI bieten hauptsächlich Fine-Tuning an. Dabei wird ein bestehendes Modell mit eigenen Daten verfeinert. Forge geht tiefer und erlaubt echtes Training von Grund auf. Das Ergebnis ist ein Modell, das die Fachsprache, Denkweisen und Regeln eines Unternehmens fundamental versteht, nicht nur oberflächlich anpasst.
Wie funktioniert es?
Forge verpackt die gleichen Training-Methoden, die Mistrals KI-Forscher intern nutzen:
- Data Pipeline: Datenerfassung, Kuratierung und synthetische Datengenerierung aus internen Quellen (Dokumentation, Codebases, strukturierte Daten)
- Pre-Training auf großen internen Datensätzen
- Post-Training mit Supervised Fine-Tuning und Preference Learning (DPO)
- Reinforcement Learning zur Ausrichtung an internen Richtlinien
- Unterstützung für Dense- und Mixture-of-Experts-Architekturen, multimodal (Text + Bild)
Mistral stellt dabei sogenannte "Forward-Deployed Engineers" bereit: Ingenieure, die direkt in Kundenteams arbeiten und beim Aufbau der Trainingspipeline helfen.
Das trainierte Modell und alle Daten gehören dem Kunden. Kein Lock-in, kein geteiltes Eigentum.
Training-Infrastruktur: Drei Optionen
| Option | Beschreibung | Datensouveränität |
|---|---|---|
| Mistral Cloud | Training auf Mistrals Infrastruktur in der EU (Paris) | EU-gehostet |
| Private Cloud | Training beim Cloud-Anbieter der Wahl | Je nach Anbieter |
| On-Premises | Docker-Images auf eigenen GPU-Clustern (min. 4x A100/H100) | Maximal |
Bei Training auf eigener Hardware: kein Compute-Aufschlag an Mistral.
Warum das für den DACH-Markt relevant ist
Nicht dem US CLOUD Act unterworfen
Der wichtigste Unterschied zu OpenAI, Google und Anthropic: Mistral ist ein französisches Unternehmen. Damit unterliegt es nicht dem US CLOUD Act, der US-Behörden Zugriff auf Daten ermöglicht, auch wenn diese auf EU-Servern liegen.
Für Unternehmen in regulierten Branchen (Finanzen, Gesundheit, öffentliche Verwaltung) ist das ein echtes Argument. Bei OpenAI und Anthropic hilft eine EU-Region nur begrenzt, weil die Muttergesellschaft in den USA sitzt.
SAP-Partnerschaft und Deutschland-Strategie
Mistral investiert gezielt in den deutschen Markt:
- SAP-Partnerschaft für einen "vollständig souveränen KI-Stack für Deutschland und Europa". Mistral-Modelle werden in SAPs AI Foundation integriert.
- Rahmenabkommen Frankreich-Deutschland (2026-2030) für souveräne KI in der öffentlichen Verwaltung, gemeinsam mit SAP. Vier Säulen: Souveränes ERP mit KI, KI-gestütztes Finanzmanagement, digitale Agenten für Bürgerservices und gemeinsame Ausbildung.
- Mistral plant die Eröffnung eines deutschen Büros.
DSGVO-konform by Design
- Daten werden standardmäßig in der EU gehostet (Server in Paris)
- Data Processing Addendum (DPA) verfügbar
- Self-Hosting-Option für maximale Kontrolle
- Voll DSGVO- und EU AI Act-konform
Vergleich: Forge vs. die Alternativen
| Mistral Forge | OpenAI Fine-Tuning | AWS Bedrock | Google Vertex | |
|---|---|---|---|---|
| Training-Tiefe | Pre-Training + Post-Training + RL | Nur Fine-Tuning | Fine-Tuning + RAG | Fine-Tuning |
| Open Weights | Ja (Apache 2.0) | Nein | Teilweise | Teilweise |
| On-Premises | Ja | Nein | Nein | Nein |
| EU-Jurisdiktion | Ja (Frankreich) | Nein (USA) | Nein (USA) | Nein (USA) |
| CLOUD Act | Nicht betroffen | Betroffen | Betroffen | Betroffen |
Für wen ist Forge geeignet?
Forge ist kein Werkzeug für kleine Teams oder Startups. Analysten schätzen die Entwicklungskosten für eine Enterprise-Lösung auf $500.000+. Das Angebot richtet sich an:
- Große Unternehmen mit eigenem KI-Talent und spezifischem Datenvorteil
- Regulierte Branchen die maximale Datensouveränität brauchen
- Öffentliche Verwaltung im Kontext der europäischen KI-Souveränität
Frühe Kunden sind ASML, Ericsson, ESA, HSBC und Stellantis. Insgesamt hat Mistral über 100 Enterprise-Kunden.
Für Entwickler: Forge ist interessant, wenn euer Unternehmen interne Codebases, Engineering-Spezifikationen oder proprietäre Architekturen hat, die ein allgemeines Modell nicht kennt. Das trainierte Modell versteht dann eure internen Abstraktionen und Patterns. Die Open-Weights-Lizenz (Apache 2.0) bedeutet: ihr könnt das Modell frei deployen und anpassen.