KI-Transformation

Prompt Engineering 2026: Vom perfekten Prompt zum Loop Engineering

Prompt Engineering galt 2022 bis 2024 als Königsdisziplin. 2026 sagen die Entwickler von Claude Code und Codex: Wir prompten nicht mehr. Was Loop Engineering ist und warum es das perfekte Prompten ablöst.

TL;DR: Prompt Engineering war von 2022 bis 2024 die zentrale KI-Fähigkeit – die Kunst, mit einer perfekten Eingabe die beste erste Antwort zu bekommen. 2026 hat sich das Bild gedreht. Boris Cherny (Anthropic, Claude Code) sagt vielfach zitiert: 'Ich prompte Claude nicht mehr. Meine Aufgabe ist es, Loops zu schreiben.' Peter Steinberger (OpenClaw) erreichte mit demselben Argument rund 6,5 Millionen Views. Loop Engineering löst das perfekte Prompten als Königsdisziplin ab. Prompt Engineering verschwindet nicht, es wird zum kleinsten Baustein in einer vierstufigen Entwicklung: Prompt, Context, Harness und schließlich Loop Engineering.

Was ist Prompt Engineering?

Prompt Engineering ist die Kunst, eine einzelne Interaktion mit einem KI-Modell zu optimieren. Du formulierst die Eingabe (den Prompt) so sorgfältig, dass das Modell mit seiner allerersten Antwort möglichst genau das liefert, was du brauchst. Im Kern behandelt dieser Ansatz das Modell wie einen Code-Generator: Du stellst eine Anfrage, bekommst eine Antwort und kopierst das Ergebnis heraus. Der Mensch hält das Werkzeug die ganze Zeit selbst in der Hand, eine Runde nach der anderen.

Gutes Prompting folgt ein paar wiederkehrenden Mustern, die das Modell zu besseren Ausgaben bewegen: • Rolle: Du weist dem Modell eine Rolle zu ('Du bist ein erfahrener Backend-Entwickler'). • Schritte: Du zerlegst die Aufgabe in einzelne, klar benannte Teilschritte. • Beispiele: Du gibst Beispiele für das gewünschte Ergebnis vor (in der Praxis der Few-Shot-Ansatz). • Schritt für Schritt denken: Du forderst das Modell explizit auf, laut mitzudenken (das Chain-of-Thought-Prinzip).

Prompt Engineering optimiert den Ausdruck, also die Formulierung. Genau darin liegt seine harte Leistungsgrenze, das sogenannte Ceiling: Ein perfekt formulierter Prompt kann dem Modell keine Fakten, Werkzeuge oder Kontexte liefern, die es nicht ohnehin schon kennt. Bei einfachen, isolierten Aufgaben reicht das. Bei echter Softwarearbeit nicht. Sobald ein Compile-Fehler auftritt, musst du manuell eingreifen: Fehler kopieren, zurück in den Chat, neu instruieren, Tests erneut laufen lassen. Die Quellen beschreiben diesen Ablauf treffend als 'Babysitting' eines Prozesses, den du eigentlich abgeben wolltest.

Warum spricht 2026 plötzlich niemand mehr von Prompt Engineering?

Weil die Modelle endlich gut genug wurden. Bis Mitte 2026 konnten Coding-Agenten lange genug autonom laufen und sich gut genug von eigenen Fehlern erholen, dass sich der Engpass verschoben hat. Wenn ein einzelner Agenten-Lauf eine Stunde dauert und Dutzende Dateien anfasst, ist nicht mehr der schärfere Prompt die größte Hebelwirkung, sondern das System drumherum. Der Begriff, der das auf den Punkt bringt, heißt Loop Engineering, und er ist in einem schmalen Zeitfenster explodiert.

Anfang Juni 2026 argumentierte Peter Steinberger, der Entwickler hinter dem Agenten-Projekt OpenClaw: Die relevante Fähigkeit sei nicht mehr das Prompten von Coding-Agenten, sondern das Designen der Loops, die diese Agenten prompten. Sein Post dominierte die Diskussion über Wochen und erreichte laut Bericht rund 6,5 Millionen Views. Kurz darauf gab der Google-Engineer Addy Osmani dem Ganzen mit seinem Essay Loop Engineering einen Namen und, nützlicher noch, eine Anatomie. Aus einem viralen Take wurde ein Vokabular, auf dem sich aufbauen lässt. Dass die Stimmung kein Hype unter Enthusiasten ist, zeigt Boris Cherny von Anthropic. Der Kopf hinter Claude Code fasste den Wandel vielfach zitiert in vier Worten zusammen: 'Ich prompte Claude nicht mehr.' Wenn die Leute, die die meistgenutzten Coding-Agenten bauen, das Prompten von Hand aufgeben, hat sich die Praxis von der Nische in den Mainstream verschoben. Hinweis: Die Idee ist älter als der Buzzword. Geoffrey Huntley beschrieb mit den Ralph Loops bereits im Juni 2025 ein 'Agentic Engineering', bei dem ein Agent anhand von Ziel, Product Requirement Documents (PRDs) und Todo-Listen zyklisch und autark arbeitet. Loop Engineering ist die populär gewordene Verdichtung dieses Konzepts.

Die vier Stufen: von Prompt zu Loop Engineering

Loop Engineering ist die vierte Stufe einer stetigen Wanderung nach außen: von den Worten, die du tippst, zu den Informationen, die das Modell sieht, zu der Umgebung, in der es läuft, bis zu dem Zyklus, der es antreibt. Wichtig: Jede Schicht umschließt die vorige, ohne sie zu ersetzen. Es sind keine Moden, die sich gegenseitig ablösen, sondern verschachtelte Ebenen.

Die erste Fähigkeit war die Formulierung. Rolle vergeben, Aufgabe in Schritte zerlegen, Beispiele liefern, Schritt für Schritt denken lassen. Prompt Engineering optimiert den Ausdruck. Sein Ceiling ist real.

Der Fokus verschob sich von den Worten auf alles, was das Modell zur Laufzeit sieht: Konversationshistorie, abgerufene Dokumente, Tool-Ausgaben, Agenten-Status. Am 18. Juni 2025 lieferte Tobi Lütke von Shopify die Definition, die hängenblieb: dem Modell allen Kontext geben, der nötig ist, damit die Aufgabe plausibel lösbar wird. Andrej Karpathy bestätigte sie als 'die delikate Kunst, das Context Window mit genau den richtigen Informationen für den nächsten Schritt zu füllen'. Prompt Engineering wurde damit zu einem Teilbereich des Context Engineerings.

Als Agenten autonome, mehrstufige Arbeit in Produktion übernahmen, kam eine neue Ebene dazu: das Harness, also das komplette Gerüst aus Scaffolding, Tools, Einschränkungen und Feedback-Mechanismen rund um einen Agenten wie Codex oder Claude Code. Harness Engineering macht Agenten verlässlich statt nur clever.

Die jüngste Stufe zoomt auf den Teil des Harness, der die Autonomie tatsächlich erzeugt: den iterativen Zyklus. Wo Harness Engineering fragt 'Welche Umgebung braucht der Agent?', fragt Loop Engineering 'Welcher Zyklus hält ihn auf Kurs, und wann stoppt er?'. Der intellektuelle Vorfahr ist das ReAct-Muster (Reason + Act) aus der Forschung von Princeton und Google (Yao et al., 2022), das Denk- und Handlungsschritte verschränkt.

Wie funktioniert Loop Engineering?

!Infografik zur Evolution der KI-gestützten Programmierung: Loop Engineering als vierte Stufe nach Prompt-, Context- und Harness-Engineering, mit Plan-Act-Verify-Schleife und den sechs Loop-Kernkomponenten Bild: KI-generiert mit NotebookLM Loop Engineering ist die Praxis, das System zu designen, das einen KI-Agenten prompt, prüft, sich erinnert und neu startet, statt jede nächste Anweisung selbst zu tippen. Die Arbeitseinheit ist nicht mehr der einzelne Prompt, sondern der Loop: ein wiederholter Zyklus, in dem das Modell eine Aktion ausführt, Feedback aus seiner Umgebung erhält, daraus den nächsten Zug ableitet und weitermacht, bis eine definierte Abbruchbedingung erreicht ist. Anders gesagt: Du bist nicht mehr die Person im Chat-Fenster, sondern die Person, die die Maschine baut, die das Chat-Fenster bedient.

Ein gut gebauter Loop folgt einem festen Ablauf, einer Variante des Plan-Act-Verify-Musters: 1. Intent: Ein messbares Ziel mit testbarer Stopp-Bedingung. 'Mach die Test-Suite grün' ist ein gutes Ziel, weil prüfbar. 'Verbessere den Code' ist ein schlechtes, weil der Loop nie weiß, wann er fertig ist. 2. Context: Der Agent sammelt relevantes Wissen: nahegelegenen Code, Dokumentation, Fehlermeldungen, Edge Cases. 3. Action: Der Agent führt die kleinste zusammenhängende Änderung aus. Kleine, reversible Diffs sind leichter zu prüfen und zu reparieren. 4. Observation: Der Agent bewertet das Resultat an echtem Feedback: Compiler-Fehler, fehlgeschlagene Tests, Linter-Ausgaben. Der Goldstandard ist die deterministische Verifikation, die ein objektives Pass/Fail liefert, das das Modell nicht wegdiskutieren kann. 5. Adjustment: Der Agent passt seinen Plan an und wiederholt, bis die Arbeit akzeptiert oder blockiert ist.

In der Praxis braucht ein Loop fünf technische Bausteine plus einen Ort zum Erinnern: • Automations: Der Herzschlag. Skripte oder geplante Tasks wecken den Loop selbstständig, etwa um jeden Morgen die CI-Fehler des Vortags zu triagieren. • Worktrees: Git-Worktrees isolieren parallele Agenten, damit zwei Agenten sich nicht gegenseitig denselben Code überschreiben. • Skills: Externes Projektwissen, oft als SKILL.md. Ohne Skills lernt der Agent dein Projekt bei jedem Start von null neu und verbrennt dafür unnötig Tokens. • Plugins und Connectors: Die Verbindung zur echten Welt über das Model Context Protocol (MCP). Damit öffnet der Agent PRs, updatet Tickets oder postet in Slack. • Sub-Agents: Die Trennung von Macher und Prüfer. Der Agent, der den Code schreibt, bewertet seine eigene Arbeit zu milde, ein unabhängiger Checker-Agent fängt das ab. • External State: Eine Markdown-Datei oder ein Board außerhalb des Chats als Gedächtnis. Das Modell vergisst zwischen den Läufen, das Repository nicht. Diese Bausteine sind keine Theorie. Sowohl Claude Code als auch Codex haben sie nativ: Claude Code über /loop, /goal, geplante Tasks, Hooks und GitHub Actions, Codex über sein eigenes /goal. Bei /goal läuft der Agent, bis eine verifizierbare Bedingung erfüllt ist, und ein separates kleines Modell prüft nach jeder Runde, ob das Ziel erreicht ist, damit nicht der Schreiber seine eigene Arbeit benotet.

Prompt Engineering vs. Loop Engineering im Vergleich

| Dimension | Prompt Engineering | Loop Engineering | |---|---|---| | Primäre Einheit | Ein Prompt oder eine Anweisung | Ein wiederholter Workflow | | Ziel | Bessere erste Antwort | Besseres Endergebnis | | Feedback | Meist menschliche Bewertung | Tests, Tools, Diffs, Logs, Reviews und Menschen | | Fehlermodus | Das Modell gibt eine schwache Antwort | Das System loopt schlecht, stoppt zu früh oder ignoriert Evidenz | | Am besten für | Isolierte Antworten und Generierung | Echte Software-Aufgaben mit Unsicherheit | Der Unterschied zwischen einem Cron-Job und einem Loop liegt im Entscheider: Ein Cron-Job führt ein festes Skript aus. In einem Loop sitzt der Entscheider innen drin. Der Agent schaut auf den aktuellen Zustand, wählt die nächste Aktion, prüft das Ergebnis und entscheidet, ob er weitermacht, neu versucht, zurückrollt oder stoppt.

Welche Vorteile bringt der Wechsel?

Während Prompt Engineering dabei hilft, eine bessere erste Antwort zu erzwingen, führt Loop Engineering zu einem besseren finalen Ergebnis. Das ist der entscheidende Unterschied bei echter Softwarearbeit. • Raus aus dem Babysitting. Statt bei jedem Compile-Fehler manuell einzugreifen, läuft die Schleife selbst gegen reale Signale wie Tests, Type Checker und Linter, statt gegen die Geduld des Entwicklers. Laut einem der Quellen-Autoren halbiert das die Schritte bis zum fertigen Ergebnis. • Arbeit passiert über Nacht. Ein Loop mit Automations entdeckt, triagiert und bearbeitet Aufgaben auf einem Zeitplan, unabhängig davon, ob das Terminal geöffnet ist. • Parallelität wird beherrschbar. Mit Worktrees laufen mehrere Agenten gleichzeitig an verschiedenen Features, ohne sich in die Quere zu kommen. • Wissen kompoundiert. Ein Loop mit guten Skills fängt nicht jeden Lauf bei null an, sondern baut auf dem auf, was schon dokumentiert ist. Genau diese Mechanik steckt hinter Konzepten wie dem Ralph Wiggum Loop.

Welche Risiken hat Loop Engineering?

Loops sind früh dran, und ihre Ökonomie ist real. Wer die Leitplanken weglässt, baut schnell einen sehr selbstbewussten Token-Ofen. • Kostenexplosion: Wenn Agenten sich unbeaufsichtigt gegenseitig prompten und bei jedem Lauf Sub-Agenten für Umsetzung und Verifizierung spawnen, brennt ein 5-Minuten-Loop laut den Quellen das Budget eines limitierten Plans 'vor dem Frühstück' durch. • Thrashing und No-Progress-Loops: Ohne saubere Stopping Rules ändert der Agent denselben Codebereich endlos, ohne zu konvergieren. Die Gegenmaßnahme: harte Iterations-Caps plus eine No-Progress-Erkennung. • Reward Hacking: Der Loop optimiert einen prüfbaren Stellvertreter statt des echten Ziels. Der Klassiker ist der Agent, der den fehlschlagenden Test löscht, um die CI grün zu bekommen. • Comprehension Debt: Je schneller der Loop Code liefert, den niemand selbst geschrieben hat, desto größer wird die Lücke zwischen dem, was existiert, und dem, was verstanden wird. Diese Verständnisschuld ist ein eigenes Problem, das im Artikel zu Cognitive Debt ausführlich behandelt wird. Faustregel: Bau den Loop wie jemand, der Entwickler bleiben will, nicht wie jemand, der das Denken abgeben möchte. Dieselbe Loop-Architektur beschleunigt den einen und ersetzt das Urteilsvermögen des anderen.

FAQ: Häufig gestellte Fragen zu Prompt Engineering und Loop Engineering

Ist Prompt Engineering 2026 tot? Nein. Prompt Engineering verschwindet nicht, es wird zum kleinsten Baustein eines größeren Systems. Prompts werden weiterhin geschrieben, Kontext weiterhin kuratiert und ein Harness weiterhin gebaut. Loop Engineering ist die Ebene, auf der all das in Bewegung gesetzt wird. Was ist der Unterschied zwischen Prompt Engineering und Loop Engineering? Prompt Engineering optimiert eine einzelne Interaktion und zielt auf die bessere erste Antwort. Loop Engineering macht daraus einen wiederholbaren Prozess über viele Interaktionen und zielt auf das bessere Endergebnis, gemessen an Tests, Tools und Reviews statt an menschlicher Einzelbewertung. Ist ein Loop nicht einfach ein Cron-Job? Nein. Ein Cron-Job führt ein festes Skript in festem Takt aus. In einem Loop sitzt der Entscheider innen: Ein Agent prüft den aktuellen Zustand, wählt die nächste Aktion, bewertet das Ergebnis und entscheidet selbst über Weitermachen, Neuversuch, Rollback oder Stopp. Was sind die vier Stufen der Entwicklung? Prompt Engineering (Worte), Context Engineering (Informationen, die das Modell sieht), Harness Engineering (Umgebung, in der es läuft) und Loop Engineering (der Zyklus, der es antreibt). Jede Stufe umschließt die vorige, ohne sie zu ersetzen. Welche Tools beherrschen Loop Engineering? Sowohl Claude Code als auch OpenAI Codex haben die nötigen Primitive nativ eingebaut, etwa über /loop und /goal, geplante Tasks, Hooks und GitHub Actions. Auch in Cursor lassen sich solche Automationen einrichten. Die 'Loop-Form' wird damit weitgehend werkzeugunabhängig. Wie verhindert man, dass ein Loop das Budget verbrennt? Über zwei Dinge, die vor allem anderen kommen: einen Trigger und ein verifizierbares Ziel. Dazu harte Stopping Rules wie Iterations-Caps, Token- und Zeitbudgets sowie eine No-Progress-Erkennung. Sub-Agenten sollten nur dann spawnen, wenn der State sagt, dass es etwas zu tun gibt.

Fazit

Prompt Engineering bleibt eine wichtige Grundfertigkeit, ist 2026 aber nicht mehr die Königsdisziplin, sondern das Fundament. Die eigentliche Hebelwirkung liegt heute in der Schleife drumherum: ein Loop mit klarem Ziel, ehrlichem Feedback und harten Stopp-Regeln, der den Menschen aus dem Babysitting holt, ohne ihn aus der Verantwortung zu entlassen. Wer das beherrscht, wird vom Prompt-Schreiber zum Architekten autonomer Systeme. Wie autonome Schleifen in der Praxis Code schreiben, zeigt der Ralph Wiggum Loop. Wie wiederverwendbares Projektwissen als Bausteine abgelegt wird, liest sich in Claude Skills 2.0, und warum Geschwindigkeit ohne Verständnis gefährlich wird, im Artikel zu Cognitive Debt. Verifizierte Quellen: Addy Osmani, 'Loop Engineering' (addyosmani.com/blog/loop-engineering, 2026); Peter Steinberger, Posts zu OpenClaw (Juni 2026); Boris Cherny, Anthropic / Claude Code (vielfach zitierte öffentliche Aussagen, 2026); Geoffrey Huntley, 'Ralph Loops' (ghuntley.com/ralph, Juni 2025); Tobi Lütke, X-Post zum Context Engineering (18. Juni 2025); Andrej Karpathy, Kommentar zu Context Engineering (2025); Yao et al., 'ReAct: Synergizing Reasoning and Acting in Language Models' (arXiv:2210.03629, 2022).