Tools
KI-Coding-Tools im Vergleich
Claude Code, Codex, Cursor, Copilot, Antigravity und Windsurf im Vergleich. Was die Tools können, was sie kosten und was sich für DACH-Teams lohnt.
Der Markt für KI-Coding-Tools bewegt sich rasant. Allein im Mai 2026 kamen innerhalb von zwei Wochen eine neue Cursor-Modellversion, eine ausgebaute Google-Dev-Suite, ein Windsurf-Update mit Devin-Bundle und ein neues Abrechnungsmodell bei GitHub Copilot. Wer gerade eine Tool-Entscheidung trifft oder die bestehende überprüfen will, verliert da leicht den Überblick. Dieser Artikel sortiert die wichtigsten Werkzeuge, ihre Stärken, ihre Preise und die Frage, für wen sich was lohnt.
Zwei Lager
Grob lassen sich die Tools in zwei Lager teilen.
Das eine ist terminal-first: Der Agent lebt in der Kommandozeile, der Editor bleibt, was er ist. Claude Code und OpenAI Codex stehen für diesen Ansatz. Wer eine bestehende Toolchain hat und den Agenten dort andocken will, fühlt sich hier wohl.
Das andere ist IDE- oder agent-first: Der Editor selbst wird zur Agentenzentrale, oft als VS-Code-Fork. Cursor, Google Antigravity und Windsurf gehören hierher. GitHub Copilot sitzt dazwischen, weil es sowohl in der IDE als auch zunehmend agentisch arbeitet.
Die Entscheidung zwischen den Lagern ist meist eine Frage der Arbeitsweise, nicht der Leistung. Beide Ansätze sind 2026 produktiv einsetzbar.
Die Tools im Einzelnen
Claude Code (Anthropic)
Der Platzhirsch im terminal-first-Lager. Claude Code läuft in Terminal, Web und Desktop und nutzt Sonnet 4.6 für den Alltag sowie Opus 4.7 für die schweren Aufgaben. Die Stärke liegt in der Code-Qualität bei komplexen Refactorings und der mittlerweile sehr ausgereiften Tool-Integration (Rules, Slash-Commands, SubAgents, Skills).
Preislich gibt es Pro für 20 Dollar, Max 5x für 100 Dollar und Max 20x für 200 Dollar pro Monat. Die Limits laufen in rollierenden 5-Stunden-Fenstern plus Wochenlimit. Seit dem Compute-Deal mit SpaceX/Colossus ist die Drosselung zu Stoßzeiten auf Pro und Max weggefallen, das war vorher ein echter Schmerzpunkt.
OpenAI Codex
Codex ist OpenAIs Antwort und kommt als CLI, IDE-Extension und Cloud-Variante. Seit April rechnet OpenAI Codex tokenbasiert ab, statt pro Nachricht. Enthalten ist Codex in ChatGPT Plus (20 Dollar) und Pro (200 Dollar), die Limits laufen wie bei Claude in 5-Stunden-Fenstern. Pro hebt die Grenzen deutlich an. Seit Mai gibt es Codex auch in der ChatGPT-Mobile-App, sodass sich laufende Cloud-Sessions von unterwegs überwachen lassen. Im Vergleich zu Claude ist Codex stärker, was Design angeht. Das kann sich aber auch mit jedem Modellupdate ändern.
Wer ohnehin ein ChatGPT-Abo hat, bekommt Codex praktisch geschenkt dazu. Das ist der größte Vorteil gegenüber Claude Code, wo das Abo dediziert fürs Coding ist.
Cursor
Cursor ist der bekannteste IDE-Fork und hat am 18. Mai Composer 2.5 veröffentlicht. Das hauseigene Modell liegt laut Anbieter bei Coding-Benchmarks auf dem Niveau von Opus 4.7 und GPT-5.5, kostet im Standard-Tarif aber nur 0,50 Dollar pro Million Input- und 2,50 Dollar pro Million Output-Token. Das ist deutlich günstiger als die Frontier-Modelle und macht Cursor für preissensible Teams interessant.
Die Abos: Pro für 20 Dollar, Pro+ für 60 Dollar und Ultra für 200 Dollar pro Monat. Ultra gibt das 20-fache der Pro-Credits. Dazu kamen Cloud-Agent-Umgebungen, eine Teams-Integration und ein Modus für mehrere parallele Agenten.
GitHub Copilot
Copilot baut sein Pricing um. Ab dem 1. Juni gilt eine Flex-Abrechnung mit AI Credits über alle Pläne hinweg. Die Preise bleiben gleich: Pro für 10 Dollar, Pro+ für 39 Dollar, dazu ein neuer Max-Tarif für 100 Dollar mit 10.000 Base-Credits und einem gleich großen Flex-Kontingent. Wichtig: Code-Vervollständigung und Next-Edit-Vorschläge bleiben in allen Plänen enthalten und verbrauchen keine Credits.
Copilot bleibt der einfachste Einstieg für Teams, die schon in GitHub leben. Die tiefe Integration in Pull Requests, Issues und Actions ist hier der Trumpf.
Google Antigravity 2.0
Mit der I/O am 19. Mai hat Google Antigravity zur eigenständigen Dev-Suite ausgebaut: Desktop-App, eine in Go geschriebene CLI und ein SDK für eigene Agenten. Das Herzstück ist die Multi-Agent-Orchestrierung mit bis zu fünf parallelen Agenten in eigenen Workspaces. Ungewöhnlich: Antigravity unterstützt nicht nur Gemini 3.5 Flash, sondern auch Claude Sonnet 4.6, Opus 4.6 und GPT-OSS 120B, ohne separate Abos.
Das auffälligste Feature ist ein Browser-Sub-Agent, der autonom durch die eigene Web-App klickt, Screenshots macht und UI gegen Spezifikationen prüft. Das hat sonst keiner. Zugang gibt es über den neuen AI-Ultra-Tier für 100 Dollar. Offen ist die Wettbewerbsfrage, ob die zugrunde liegende Chrome-Automatisierungsschnittstelle auch anderen Anbietern offensteht oder nur Google selbst.
Windsurf 2.0
Windsurf hat sein Pro-Abo von 15 auf 20 Dollar angehoben und einen Max-Plan für 200 Dollar eingeführt. Das Verkaufsargument ist die Bündelung mit Devin: Devin Cloud und die Devin Terminal CLI sind jetzt Teil des Pakets. Dazu kam ein Adaptive Model Router, der je nach Aufgabe automatisch das passende Modell wählt. Für Teams, die autonome, länger laufende Agenten suchen, ist das ein eigenes Profil.
Preise auf einen Blick
| Tool | Einstieg | Mitte | Top |
|---|---|---|---|
| Claude Code | Pro 20 $ | Max 5x 100 $ | Max 20x 200 $ |
| OpenAI Codex | ChatGPT Plus 20 $ | - | ChatGPT Pro 200 $ |
| Cursor | Pro 20 $ | Pro+ 60 $ | Ultra 200 $ |
| GitHub Copilot | Pro 10 $ | Pro+ 39 $ | Max 100 $ |
| Antigravity | im AI Ultra 100 $ | - | - |
| Windsurf | Pro 20 $ | - | Max 200 $ |
Alle Preise pro Monat, Stand Mai 2026. Bei den meisten Anbietern laufen darunter zusätzlich nutzungs- oder tokenbasierte Limits, ein direkter Preisvergleich greift also zu kurz. Wer viel verbraucht, sollte die tatsächlichen Token- oder Credit-Kosten gegen die eigene Last rechnen.
Was sich für wen lohnt
Wer Code-Qualität bei komplexen Aufgaben über alles stellt, fährt mit Claude Code am sichersten. Die Opus-4.7-Anbindung und die ausgereifte Workflow-Steuerung sind dafür das beste Paket.
Wer schon ein ChatGPT-Abo nutzt, bekommt mit Codex ein starkes Tool ohne Zusatzkosten, gerade die Mobile-Überwachung von Cloud-Sessions ist praktisch.
Wer im Editor lebt und ein flüssiges IDE-Erlebnis will, ist bei Cursor gut aufgehoben. Composer 2.5 senkt die Kosten spürbar, ohne bei der Qualität viel zu verlieren.
Wer ohnehin tief in GitHub steckt, hat mit Copilot den geringsten Reibungsverlust. Die Flex-Abrechnung ab Juni macht die Kosten allerdings schwerer planbar, das gehört auf die Agenda.
Wer autonome Browser-Tests gegen die eigene UI fahren will, findet das in dieser Form nur bei Antigravity. Und wer länger laufende, eigenständige Agenten sucht, sollte sich das Windsurf-Devin-Bundle ansehen.
Fazit
Der Markt verdichtet sich, und die gute Nachricht ist: Es gibt keinen klaren Verlierer. Die Modelle sind nah beieinander, die Unterschiede liegen in Workflow, Integration und Preis. Statt nach dem einen besten Tool zu suchen, lohnt es sich, das eigene Arbeitsumfeld ehrlich anzuschauen: Wo lebt das Team, welche Toolchain ist gesetzt, wie sieht das Budget aus. Die Antwort darauf entscheidet meist klarer als jede Benchmark-Tabelle.
Wer den Workflow rund um diese Tools schärfen will, findet in unserem Artikel zu EXACT Coding und der BMad-Methode zwei methodische Ergänzungen, die unabhängig vom gewählten Werkzeug funktionieren.
Quellen6
- Anthropic - Claude Codeanthropic.com
- OpenAI Developers - Codex Pricingdevelopers.openai.com
- Cursor - Models & Pricingcursor.com
- The Decoder - Cursors Composer 2.5 matches Opus 4.7 and GPT-5.5 benchmarksthe-decoder.com
- GitHub Blog - Copilot individual plans: flex allotments and a new Max plangithub.blog
- 9to5Google - Google flips Antigravity into an agentic dev suite9to5google.com