Workflow

KI-Tools effizient nutzen: 9 Regeln

Tokens sparen, Halluzinationen erkennen, Agenten sinnvoll aufteilen. Praktische Regeln für den Arbeitsalltag mit Claude, ChatGPT und Co.

15. Mai 20268 Min. Lesezeit

Die meisten Leute nutzen KI-Tools wie ein Gespräch: Frage rein, Antwort raus, nächste Frage. Das funktioniert, ist aber ungefähr so effizient wie mit dem Auto zum Briefkasten fahren.

Wer regelmäßig mit Claude, ChatGPT oder anderen KI-Assistenten arbeitet, kann mit ein paar Anpassungen deutlich mehr rausholen, ohne mehr zu bezahlen oder öfter an Limits zu stoßen.

1. Verstehe, wofür du bezahlst

KI-Tools zählen keine Nachrichten. Sie zählen Tokens. Ein Token ist ungefähr drei Viertel eines Wortes.

Das Problem: Bei jeder neuen Nachricht liest das Modell die gesamte bisherige Konversation nochmal. Deine erste Nachricht kostet vielleicht 500 Tokens. Die zehnte schon 5.000. Die dreißigste? Über 200.000.

Ein Entwickler namens Aniket Parihar hat das gemessen: 98,5% seiner Tokens gingen fürs Wiedereinlesen alter Nachrichten drauf. Nur 1,5% für die eigentliche Antwort.

Sobald du das einmal verstanden hast, ergeben die nächsten Regeln von alleine Sinn.

2. Neue Konversation statt Endlos-Chat

Viele Leute führen einen einzigen Chat über den ganzen Arbeitstag. Nach 30 Nachrichten ist jede weitere Antwort ein kleines Vermögen.

Besser: Alle 10 bis 15 Nachrichten einen neuen Chat anfangen. Wenn du Kontext übertragen willst, bitte das Modell um eine Zusammenfassung, kopiere die in den neuen Chat.

Bei Claude Code passiert das automatisch: Die eingebaute Compaction-Funktion fasst den bisherigen Kontext zusammen, wenn das Context Window voll wird. Bei der Web-Version von Claude oder ChatGPT musst du das manuell machen.

3. Bündle deine Fragen

Drei separate Nachrichten bedeuten drei Context-Loads. Eine Nachricht mit drei Fragen bedeutet einen Context-Load.

Statt:

"Fasse diesen Artikel zusammen."
"Was sind die Hauptpunkte?"
"Schlag eine Überschrift vor."

Lieber:

PromptClaude · Effizienz

Fasse diesen Artikel zusammen, liste die Hauptpunkte auf und schlag eine Überschrift vor.

Gleiche Ergebnisse, ein Drittel der Kosten. Und oft sogar bessere Antworten, weil das Modell den Gesamtkontext sieht.

4. Korrigiere durch Editieren, nicht durch Nachfragen

Wenn die Antwort nicht passt, ist der Reflex: eine Korrektur-Nachricht schicken. "Nein, ich meinte eigentlich..." Das verdoppelt den Kontext, ohne neuen Wert zu schaffen.

In der Web-Oberfläche von Claude und ChatGPT kannst du stattdessen deine ursprüngliche Nachricht editieren und neu generieren lassen. Der alte Austausch wird ersetzt statt gestapelt.

In Claude Code funktioniert das anders: Dort ist /clear dein Freund. Kontext verwerfen, Aufgabe neu und präziser formulieren.

5. Wähle das richtige Modell

Nicht jede Aufgabe braucht das stärkste Modell. Wer für eine Rechtschreibprüfung Opus nimmt, verbrennt Budget, das anderswo fehlt.

Eine Faustregel: Haiku oder GPT-4o mini für schnelle Sachen wie Formatierung und Grammatik. Sonnet oder GPT-4o für reguläre Arbeit. Opus oder o3 nur wenn du wirklich nachdenken lassen willst, also Architektur-Entscheidungen, schwierige Bugs, lange Dokumente.

In Claude Code wechselst du mit /model zwischen Modellen. In der Web-Oberfläche ist es ein Dropdown. Es lohnt sich, das bewusst zu nutzen statt immer auf dem Default zu bleiben.

6. Halluzinationen erkennen und reduzieren

KI-Modelle erfinden Dinge. Das ist keine Fehlfunktion, das ist eine Eigenschaft. Sprachmodelle sagen das nächste wahrscheinliche Wort voraus, und manchmal ist das wahrscheinlichste Wort falsch.

Wo Halluzinationen besonders häufig auftreten:

Links und URLs: Modelle generieren plausibel aussehende Links, die ins Leere führen. Immer prüfen.
Bibliotheken und Pakete: "Slopsquatting" ist ein reales Problem. KI-Modelle empfehlen Pakete, die es nicht gibt, und Angreifer registrieren genau diese Namen.
Zahlen und Statistiken: Modelle runden kreativ, verwechseln Zeiträume oder vermischen Quellen.
API-Dokumentation: Funktionsnamen und Parameter, die es in der aktuellen Version nicht mehr gibt.

Dagegen hilft vor allem eins: prüfen. Jede Zahl, jeder Link, jeder Package-Name. Ja, das kostet Zeit. Weniger als der Bug, der durch eine halluzinierte API-Signatur entsteht.

Frag das Modell nach Quellen: "Woher hast du diese Information?" Es kann nicht immer liefern, aber die Frage zwingt es dazu, unsichere Behauptungen als solche zu kennzeichnen.

Und gib weniger Freiraum. Je präziser der Kontext, desto weniger Raum zum Halluzinieren. Statt "Schreib mir eine Funktion die X macht" besser "Schreib mir eine Funktion die X macht, nutze dafür Bibliothek Y in Version Z".

7. Teile komplexe Aufgaben auf

Ein einzelner KI-Agent, der gleichzeitig recherchiert, plant und implementiert, macht alles davon mittelmäßig. Das ist kein Modellproblem, das ist ein Kontextproblem. Je mehr verschiedene Aufgaben in einem Kontext stecken, desto verwässerter wird jede einzelne.

Besser: Spezialisierte Agenten für spezialisierte Aufgaben.

In Claude Code geht das mit Sub-Agents. Du kannst einen Agenten für Recherche losschicken, einen für Code-Review und einen für Tests. Jeder bekommt seinen eigenen Kontext und kann sich auf eine Sache konzentrieren.

PromptClaude Code · Sub-Agent Recherche

Recherchiere die aktuelle API-Dokumentation für Stripe Checkout v2. Fasse zusammen: welche Endpoints gibt es, welche Parameter sind Pflicht, was hat sich seit v1 geändert.

Das Ergebnis fließt dann als kompakter Input in den nächsten Schritt, statt als riesiger Kontext im selben Chat mitzulaufen.

Auch ohne Claude Code funktioniert das Prinzip: Verschiedene Chats für verschiedene Aufgaben. Recherche in Chat 1, Implementierung in Chat 2 mit den Ergebnissen aus Chat 1 als Startpunkt.

8. Lass die KI ihre eigene Arbeit prüfen

Der einfachste Qualitätsgewinn: Lass ein zweites Modell (oder dasselbe Modell in einem neuen Chat) die Arbeit des ersten prüfen.

PromptClaude · Review

Prüfe diesen Code auf Fehler, Sicherheitslücken und fehlende Edge Cases. Sei kritisch.

Das klingt banal, aber die Fehlerquote sinkt erheblich. Eine Gitclear-Studie zeigt, dass KI-generierter Code 1,7-mal mehr Fehler pro Pull Request enthält als menschlicher Code. Ein systematischer Review-Schritt fängt einen großen Teil davon ab.

In der Praxis sieht das so aus:

Agent 1 schreibt Code
Agent 2 reviewed (anderer Kontext, anderer Blickwinkel)
Agent 1 arbeitet Feedback ein
Mensch prüft das Ergebnis

Wir haben das Prinzip im Artikel Die KI-Controlling-Schleife ausführlich beschrieben. Dort findest du auch, wie du das Vier-Augen-Prinzip auf KI-Workflows überträgst.

9. Lass Dinge automatisch prüfen

Wenn du Inhalte generierst, die Links enthalten, lass die KI ein Skript schreiben, das diese Links automatisch beim Commit extrahiert und prüft. So verhinderst du, dass kaputte Links durchrutschen.

Hast du Code generiert, lass vor dem Commit alle Tests laufen. Die KI wird "vergessen" sie zu starten, egal wie oft du sie erinnerst.

Generiert die KI Texte mit Formulierungen, die du nicht magst, lass per Skript prüfen, dass sie nicht vorkommen.

Immer wenn du dich über etwas geärgert hast, was die KI generiert hat, schau ob du das in Zukunft automatisch erkennen kannst. Git-Hooks, CI-Pipelines und Linter-Regeln sind deine Verbündeten. Die KI macht zuverlässig dieselben Fehler, also lohnt sich jede automatische Prüfung doppelt.

Bonusregel: Kontext ist alles

Die meisten unbefriedigenden KI-Antworten kommen nicht von einem schlechten Modell, sondern von schlechtem Kontext. Das Modell weiß nicht, wer du bist und was du vorhast.

Projektdateien helfen enorm: Claude Projects, ChatGPT GPTs und Claude Code's CLAUDE.md laden Kontext automatisch in jede Konversation. Einmal einrichten, dauerhaft profitieren.

Nenn deine Rolle und dein Ziel. "Ich bin Backend-Entwickler und arbeite an einer Spring-Boot-App. Wir nutzen PostgreSQL 16 und Java 21." Das spart fünf Rückfragen.

Und zeig Beispiele statt zu erklären. Ein gutes Beispiel ist mehr wert als drei Absätze Beschreibung.

Und dann?

Diese Regeln klingen vielleicht offensichtlich. Aber die Erfahrung zeigt: Die meisten Leute brechen mindestens drei davon regelmäßig. Und der Unterschied zwischen "KI ist ganz nützlich" und "KI verändert meinen Arbeitsalltag" liegt oft genau in diesen Details.

Fang mit einer Regel an. Die mit den neuen Konversationen (Regel 2) bringt den schnellsten Effekt.

Wer tiefer einsteigen will: Von Vibe Coding zu Agentic Engineering beschreibt, wie sich die Zusammenarbeit mit KI-Tools gerade grundlegend verändert. Und Guided Determinism zeigt, wie man KI-Agenten in strukturierte Workflows einbettet statt sie einfach laufen zu lassen.

Quellen4