Grundlagen

Was Hummeln über kleine KI-Modelle verraten

Hummeln lösen mit unter einer Million Neuronen Aufgaben wie Schimpansen. Was das über unsere Vorurteile gegenüber kleinen KI-Modellen verrät.

5. Juni 20267 Min. Lesezeit

Eine Hummel steht in einer kleinen Arena. Über ihr, an der Decke, klebt eine künstliche blaue Blüte mit Zuckerwasser, viel zu hoch zum Hinfliegen. Am Boden liegt ein Schaumstoffball. Die Hummel hat vorher gelernt, dass sich so ein Ball schieben lässt, und sie hat gelernt, dass die blaue Blüte Futter bedeutet. Beides aber getrennt, nie zusammen. Jetzt steht sie zum ersten Mal vor dem ganzen Problem: Ball unter die Blüte rollen, hochklettern, ans Zuckerwasser kommen.

Über 70 Prozent der Hummeln haben genau das getan, beim ersten Versuch, ohne Anleitung. Das berichten Forschende der Universität Oulu um den Verhaltensökologen Olli Loukola im Juni 2026 im Fachjournal Science (heise). Das Besondere: Die Tiere konnten die Blüte gar nicht sehen, während sie den Ball schoben. Sie mussten ein Zwischenziel ansteuern, dessen Sinn sich erst am Ende erschließt. Genau das galt lange als Domäne von Primaten.

Ein Insekt mit dem Werkzeugkasten eines Affen

Das Hummel-Experiment ist kein Ausreißer. Schon 2017 zeigte eine Gruppe um Lars Chittka an der Queen Mary University in London, dass Hummeln einen Ball zu einer Markierung rollen, um an Belohnung zu kommen, und dass sie das durch Beobachtung voneinander lernen (Science). Mehr noch: Tiere, die einer Artgenossin zuschauten, lösten die Aufgabe danach effizienter, als ihnen vorgemacht wurde. Sie kopierten nicht, sie verbesserten (scinexx).

Andere Versuche aus demselben Umfeld sind ähnlich verblüffend. Bienen ziehen an Fäden, um an unter Glas liegenden Nektar zu kommen. Sie zählen bis vier, verstehen das Konzept der Null und erkennen menschliche Gesichter auf Fotos wieder. Und das alles mit einem Gehirn von weniger als einer Million Nervenzellen. Zum Vergleich: Ein menschliches Gehirn hat rund 86 Milliarden Neuronen, also etwa hunderttausendmal so viele.

Die Forschenden in London haben sogar gezeigt, dass Bienen die einfache Zählaufgabe mit gerade einmal vier spezialisierten Nervenzellen bewältigen (QMUL). Nicht weil sie so viel Hirn haben, sondern weil sie sehr sparsame Strategien gefunden haben, die wenig Rechenleistung brauchen.

Warum uns das überrascht

Dass uns diese Befunde überraschen, sagt mehr über uns als über die Hummeln. Wir haben Intelligenz lange als eine Leiter gedacht, an deren Spitze der Mensch steht und darunter, nach Hirngröße sortiert, alle anderen. Insekten landeten ganz unten, irgendwo zwischen Reflex und Automat. Ein Tier mit so wenig Hirnmasse, so die unausgesprochene Annahme, kann nicht wirklich denken.

Diese Annahme war falsch, und der Grund ist simpel: Komplexität steckt nicht in der schieren Zahl der Neuronen, sondern darin, wie sie verschaltet sind und welche Algorithmen darauf laufen. Ein kleines, klug organisiertes System schlägt ein großes, das seine Kapazität verschwendet. Die Hummel ist kein langsamer Mensch mit zu wenig Hirn. Sie ist etwas anderes, das auf seine eigene Art erstaunlich kompetent ist.

Der Sprung zur KI, mit Sicherheitsnetz

Hier muss ich kurz bremsen, sonst kippt der Artikel ins Schiefe. Es ist verlockend, eine saubere Gleichung aufzumachen: Hummelhirn verhält sich zu Primatenhirn wie kleines KI-Modell zu großem. Diese Gleichung stimmt nicht. Neuronen sind keine Parameter, biologische und künstliche Netze funktionieren grundverschieden, und "weniger Bauteile" heißt bei Modellen nicht dasselbe wie bei Gehirnen. Wer die Analogie wörtlich nimmt, baut sich einen Strohmann.

Aber als Bild taugt die Hummel trotzdem, und zwar wegen einer tieferliegenden Pointe. Wenn Problemlösung in so unterschiedlichen Substraten entsteht, in einem Insektenhirn, einem Primatenhirn und in Silizium, dann ist die Größe des Systems offensichtlich der falsche Maßstab. Was zählt, ist, ob das System die konkrete Aufgabe löst. Genau diesen Maßstab legen wir bei KI selten an. Wir reden über Parameterzahlen und Benchmark-Ranglisten, als wäre größer automatisch besser, und greifen im Zweifel zum dicksten verfügbaren Modell. So wie wir der Hummel ihre Intelligenz absprachen, sprechen wir kleinen Modellen ihre Brauchbarkeit ab.

Was das praktisch heißt

Im Alltag von Entwicklung, Projektarbeit und QA besteht ein großer Teil der KI-Aufgaben nicht aus tiefem Schlussfolgern, sondern aus solidem Handwerk: Texte klassifizieren, Daten aus E-Mails extrahieren, Tickets zusammenfassen, Anfragen an die richtige Stelle routen. Für diese Aufgaben sind die kleinen, günstigen Modelle oft völlig ausreichend, und sie sind dramatisch billiger.

flowchart TB
  A["Konkrete Aufgabe"] --> B{"Einfaches Handwerk?<br/>Klassifikation, Extraktion,<br/>Zusammenfassung, Routing"}
  B -->|"ja"| C["Kleines Modell testen<br/>(z. B. Haiku)"]
  B -->|"nein, tiefes<br/>Schlussfolgern"| E["Großes Modell<br/>(z. B. Opus)"]
  C --> D{"Qualität<br/>ausreichend?"}
  D -->|"ja"| F["Dabei bleiben,<br/>Faktor 5 gespart"]
  D -->|"nein"| E
  class B,D decision
  class F success
  classDef decision fill:#1A3A4A,stroke:#F59E0B,color:#FDE68A
  classDef success fill:#14532D,stroke:#22C55E,color:#86EFAC

Faustregel: erst das kleine Modell testen, nur bei Bedarf hochstufen.

Wie groß der Unterschied ist, zeigt ein Blick auf die Preisliste. Drei Beispiele aus der Claude-Familie, Stand Juni 2026 (Anthropic):

Modell	Input pro Mio. Token	Output pro Mio. Token	Stärke
Haiku 4.5	1 $	5 $	schnell, günstig, Alltagsaufgaben
Sonnet 4.6	3 $	15 $	Allrounder für Produktion
Opus 4.8	5 $	25 $	komplexes Schlussfolgern

Bei reinen Routineaufgaben liegt das kleine Modell beim Input um den Faktor fünf günstiger. Anthropic rechnet als Beispiel vor, dass die Bearbeitung von 10.000 Support-Tickets mit Haiku rund 37 US-Dollar kostet. Wer dafür reflexhaft zum größten Modell greift, zahlt das Mehrfache für eine Qualität, die der Nutzer am Ende oft gar nicht bemerkt.

Das ist aber kein Freibrief, alles auf die kleinste Stufe zu stellen. Bei Aufgaben mit echtem Schlussfolgern macht das größere Modell einen messbaren Unterschied. In Anthropics Verhandlungs-Experiment "Project Deal" schnitten Nutzer mit dem kleinen Modell spürbar schlechter ab, hielten ihre Ergebnisse aber für genauso fair (mehr dazu im Artikel über Probleme, die KI heute löst). Die ehrliche Faustregel lautet deshalb nicht "klein ist besser", sondern: Fang mit dem kleinen Modell an, prüf das Ergebnis, und stuf nur dann hoch, wenn die Qualität wirklich nicht reicht. Wie sich das im Team systematisch angehen lässt, steht in KI-Kosten im Team senken und in den neun Regeln zum effizienten KI-Einsatz.

Demut als Haltung

Zurück zur Hummel in ihrer Arena. Über Jahrzehnte haben wir ihr jede Form von Einsicht abgesprochen, weil ihr Gehirn zu klein wirkte für unseren Begriff von Intelligenz. Wir haben sie an unserem eigenen Maßstab gemessen und das meiste davon übersehen.

Bei KI riskieren wir denselben Fehler, nur andersherum: Wir sortieren Modelle nach Größe und übersehen, wie weit ein kleines schon trägt. Die Lehre aus der Hummel ist nicht, dass klein gleich klug ist. Sie ist, dass Größe wenig darüber sagt, ob ein System die Aufgabe vor sich löst. Das herauszufinden, kostet einen Test. Es lohnt sich, ihn zu machen, bevor man zum großen Modell greift.

Quellen5