Anthropic lässt Claude-Agenten "träumen", um aus Fehlern zu lernen

Anthropic gibt Claude-Agenten eine geplante Selbstreflexion

Auf der zweiten Ausgabe der Entwicklerkonferenz Code with Claude in San Francisco hat Anthropic am 6. Mai 2026 eine Funktion namens Dreaming für Claude Managed Agents vorgestellt. Sie läuft als geplanter Hintergrundprozess, der vergangene Sitzungen und Erinnerungsspeicher eines Agenten durchforstet, Muster extrahiert und einen überarbeiteten Memory-Layer erzeugt, den Teams prüfen, anpassen oder ablehnen können.

Was Dreaming tatsächlich macht

Dreaming ist laut Anthropic und Simon Willisons Liveblog vom 6. Mai 2026 keine Trainingsphase, sondern eine Memory-Curation. Das System fasst doppelte Einträge zusammen, entfernt veraltete Notizen und hebt wiederkehrende Muster hervor, etwa typische Fehlerquellen in einem bestimmten Workflow oder wiederholte Vorlieben eines Teams.

Drei zusammenarbeitende Layer

Laut 9to5Mac und der Anthropic-Veröffentlichung umfasst die neue Generation der Managed Agents drei Bausteine. Erstens Memory: agentenübergreifende Erinnerung, die über Sitzungen hinweg lebt. Zweitens Outcomes: ein Bewertungssystem, das Erfolg und Misserfolg von Aktionen verfolgt. Drittens Dreaming: die geplante Konsolidierung dieser Erinnerungen.

Numerische Ergebnisse

Anthropic nennt zwei Früh-Anwender. Harvey, ein KI-Anbieter für juristische Arbeit, meldet laut Pressemitteilung eine etwa sechsmal höhere Aufgabenfertigstellungsrate nach Einführung von Dreaming. Wisedocs, spezialisiert auf medizinische Dokumentenprüfung, halbierte laut den Anthropic-Angaben die durchschnittliche Prüfdauer pro Dokument.

Warum das wichtig ist

Langzeit-Erinnerung ist seit Monaten der Engpass agentischer KI. Wenn ein Agent jeden Tag bei null beginnt, kann er nichts aus dem System lernen, in dem er tätig ist. Dreaming legt einen Layer zwischen Modell und Aufgabenwelt, der wiederkehrende Erfahrungen verdichtet und einsetzbar macht.

Anthropic positioniert sich damit gegen Anbieter wie OpenAI oder Google, die in den letzten Wochen ebenfalls erweiterte Memory-Mechaniken angekündigt haben. Im Unterschied zur klassischen RAG-Architektur, die externe Dokumente einliest, geht es bei Dreaming um die Aufarbeitung interner Sitzungsdaten und um Governance: Teams sollen die Vorschläge der Konsolidierung prüfen können, bevor sie in produktive Agenten fließen.

Einfach erklärt

Stell dir vor, eine Hilfskraft im Büro schreibt sich jeden Tag Notizen über Aufgaben, Fehler und kleine Tricks. Am Ende der Woche setzt sie sich hin, ordnet die Zettel, wirft Doppeltes weg und schreibt einen sauberen Spickzettel. Genau das macht Anthropics Dreaming für Claude-Agenten: Sie räumen ihre eigenen Notizen auf und werden dadurch beim nächsten Auftrag schneller und treffsicherer.

Praktisches Beispiel

Eine deutsche Mittelstandskanzlei mit 60 Anwältinnen und Anwälten setzt 2026 einen Claude-Managed-Agenten für Vertragsprüfungen ein. In den ersten vier Wochen sammelt der Agent in jeder Sitzung Notizen zu typischen Klausel-Stolperfallen im deutschen Mietrecht. Nach dem ersten Dreaming-Lauf liegt eine kuratierte Erinnerungsschicht vor, die wiederkehrende Prüfmuster, kanzleispezifische Templates und vermeidbare Fehler enthält. Die Anwälte prüfen die Vorschläge, lehnen zwei davon ab und übernehmen den Rest. In der Folge sinkt die durchschnittliche Bearbeitungszeit pro Mietvertrag von 38 Minuten auf 24 Minuten, und die Quote nachträglicher Korrekturen halbiert sich.

Einordnung und Grenzen

Erstens ist Dreaming laut Anthropic in einer Research-Preview-Phase. Sie verspricht keine produktiven SLAs und kann sich ändern.

Zweitens sind die zitierten Zahlen Anbieter-Eigenangaben. Sechsfache Aufgabenfertigstellung bei Harvey und 50 Prozent kürzere Prüfzeit bei Wisedocs sind nicht durch unabhängige Audits belegt und beziehen sich auf konkrete Workflows, die für andere Branchen nicht repräsentativ sein müssen.

Drittens bleibt die Memory-Konsolidierung ein potenzielles Sicherheitsrisiko: Wenn ein Agent unkritisch Patterns lernt, die durch präparierte Eingaben entstehen, kann sich Prompt-Injection langfristig in den Erinnerungsspeicher fressen. Anthropic begegnet dem mit einer Approve-, Modify- oder Reject-Schnittstelle, doch die Verantwortung liegt am Ende beim Betreiber.

SEO- und GEO-Schlüsselbegriffe

Anthropic, Claude, Dreaming, Managed Agents, Code with Claude, Memory Consolidation, Agentic AI, Harvey, Wisedocs, AI Agents, Outcomes, Multi-Agent Orchestration, 2026.