
Fortgeschrittene KI-Agenten: Planung, Multi-Agenten und Human-in-the-Loop (Teil 2)

Michael Haushofer
29. Mai 2025
Während wir im ersten Teil die einzelnen Fähigkeiten isoliert beleuchtet haben, geht es jetzt um das Orchestrieren mehrerer Fähigkeiten, komplexere Architekturen und die Einbindung des Menschen an den richtigen Stellen. Entscheider sollen erkennen, wie sich mit Planung, Multi-Agenten-Systemen, agentenbasierter Wissensabfrage (RAG) und Human-in-the-Loop die nächste Ausbaustufe der intelligenten Automatisierung gestalten lässt.
Planning Agent – erst planen, dann ausführen
Im Planning-Agent-Pattern erhält der KI-Agent die Fähigkeit, im Voraus einen ganzen Auftragsplan zu entwerfen, bevor er ins Handeln kommt. Im Gegensatz zum ReAct-Ansatz (Schritt-für-Schritt mit jedem Teilschritt sofortiger Ausführung) durchläuft ein Planning Agent typischerweise zwei Phasen: Planung und Ausführung.
Zunächst erstellt der Agent aus der gegebenen Aufgabe eine strukturierte Liste von Teilschritten (oft in Pseudocode-Form oder als Aufzählung von Aktionen). Anschließend werden diese Schritte der Reihe nach abgearbeitet, entweder vom selben Agenten oder von spezialisierten Executor-Instanzen. Falls während der Ausführung neue Erkenntnisse auftauchen oder ein Schritt scheitert, kann der Agent den Plan dynamisch anpassen.
Warum Planung?
Zwei Hauptgründe sprechen für diesen Ansatz: Effizienz und globale Kohärenz.
Beim klassischen ReAct muss das LLM für jeden Zwischenschritt neu aufgerufen werden, was langsam und kostenintensiv sein kann. Ein vorab erstellter Plan erlaubt es, bestimmte einfache Schritte ohne ständigen LLM-Aufruf durchzuführen und nur bei Bedarf wieder "nachzudenken".
Zudem zwingt die Gesamtplanung den Agenten, das große Ganze der Aufgabe zu betrachten, statt nur kurzsichtig von Schritt zu Schritt zu gehen. Reines ReAct endet manchmal in suboptimalen Schleifen, weil der Agent keinen globalen Überblick hat.
Praktisches Beispiel: Automatisierte Wettbewerbsanalyse
Ein Agent soll "eine Wettbewerbsanalyse der Branche Y" erstellen. Ein Planning Agent würde etwa folgendermaßen starten:
Plan:
- Liste der Hauptwettbewerber zusammenstellen
- Für jeden Wettbewerber Kennzahlen (Umsatz, Mitarbeiterzahl, Marktanteil) ermitteln
- Öffentliche Produktportfolios vergleichen
- Ergebnisse in strukturierte Tabelle zusammenfassen
- Insights und strategische Empfehlungen formulieren
Ausführung:
- Schritt 1: API-Call an Unternehmensverzeichnisse oder Websuche nach Unternehmen in Branche Y
- Schritt 2: Für jeden gefundenen Wettbewerber Datenabfrage in öffentlichen Quellen
- Schritt 3: Produktvergleich über Website-Crawling oder Produktdatenbanken
- Schritt 4: Daten strukturiert aufbereiten (ggf. mit CodeAct)
- Schritt 5: LLM-gestützte Analyse und Empfehlungsgenerierung
Sollte unterwegs ein Schritt fehlschlagen (etwa ein API-Call liefert nichts), kann er den Plan modifizieren (z. B. alternative Datenquelle nutzen).
Vorteile im Unternehmen
Planning Agents eignen sich besonders für komplexe, mehrstufige Workflows – z. B. Berichtswesen, Projektmanagement-Aufgaben, mehrteilige Abfragen. Indem der Agent einen Plan erstellt, lässt er sich auch besser überprüfen oder sogar von Menschen beeinflussen ("Zeige mir zunächst deinen Plan, bevor du ausführst").
In kritischen Unternehmensprozessen kann man so dem Agenten zwar Autonomie geben, aber trotzdem Kontrolle über den geplanten Ablauf behalten. Zudem lassen sich Planungskomponenten wiederverwenden: Einmal definierte Plan-Schritte können als Vorlage für ähnliche Aufgaben dienen.
Multi-Agenten-Systeme – Teamwork unter KI-Agenten
Bisher haben wir den Agenten als einzelnes "Allround-Talent" betrachtet. Multi-Agenten-Systeme gehen einen Schritt weiter: Hier arbeiten mehrere spezialisierte KI-Agenten zusammen, um komplexe Aufgaben effizienter zu bewältigen.
Man kann sich das vorstellen wie ein Team aus Experten, das von einem Supervisor-Agenten koordiniert wird. Jeder Agent kann eine eigene Rolle oder Fähigkeit haben – zum Beispiel ein Agent, der besonders gut plant, ein anderer mit Zugriff auf spezielle Datenbanken, ein weiterer als Kreativassistent für Textgenerierung.
Weshalb mehrere Agenten?
Einige Probleme sind zu umfangreich oder vielseitig, als dass ein einzelner Agent mit begrenztem Kontext alles optimal erledigen könnte. Bei zu vielen Tools und Informationen für einen Agenten steigt die Wahrscheinlichkeit, dass er den Überblick verliert.
Stattdessen können Multi-Agent-Frameworks die Komplexität aufteilen: Jeder Agent behält einen fokussierten Kontext. Außerdem ermöglicht der Ansatz, spezialisierte KI-Modelle einzusetzen – z. B. einen großen LLM für Planung/Koordination und kleinere, schnellere Modelle für Routineaufgaben.
Wie funktioniert das Zusammenspiel?
Meistens gibt es zwei Kernkomponenten in Multi-Agent-Architekturen:
- Die Agenten selbst mit ihren individuellen Profilen, Fähigkeiten und Tool-Zugängen
- Einen Kommunikations- und Koordinationsmechanismus – das kann ein führender Agent sein oder ein festgelegtes Protokoll
Ein bewährtes Beispiel ist das Critic & Solver-Modell: Ein Agent generiert eine Lösung, ein zweiter Agent kritisiert oder prüft sie (quasi als automatisierter Peer-Review), worauf der erste Agent die Lösung verbessert. Dieses Zwei-Agenten-Setting imitiert eine Art interne "Vier-Augen-Prüfung" durch KI und hat sich als sehr effektiv erwiesen.
Unternehmensbeispiel: Kundenservice-Automation
Angenommen, eine Firma möchte einen KI-Agenten für den Kundenservice einsetzen. Dieser soll Anfragen klassifizieren, Lösungen vorschlagen und Antworten formulieren. Hier könnte man ein Multi-Agenten-System designen:
- Agent A: Spezialisiert auf Anfrageklassifizierung (Support, Vertrieb, Reklamation)
- Agent B: Technischer Experte (durchsucht Produktdokumentation und technische Artikel)
- Agent C: Kommunikationsexperte (formuliert kundenfreundliche Antworten im Marken-Tonfall)
- Supervisor-Agent: Koordiniert die Zusammenarbeit und entscheidet über Eskalation
Workflow:
- Supervisor empfängt Kundenanfrage
- Agent A klassifiziert die Anfrage
- Agent B sucht passende Lösungen in der Wissensdatenbank
- Agent C formuliert die Antwort
- Supervisor prüft Ergebnis und entscheidet über Versendung oder menschliche Eskalation
So entsteht ein modularer Workflow, den man leicht anpassen kann (z. B. einen Agent D hinzufügen, der Kundenzufriedenheit bewertet).
Multi-Agent-Systeme erhöhen zwar die Komplexität der Implementierung, bieten aber höhere Flexibilität und Fehlertoleranz – fällt ein Teil aus oder kommt zu keinem Schluss, kann der Supervisor anders routen.
Agentic RAG – Wissensabruf auf Abruf
Der Begriff RAG steht für Retrieval-Augmented Generation, also durch Abruf angereicherte Generierung. Im Kontext von KI-Agenten bedeutet Agentic RAG, dass der Agent aktiv auf externe Wissensquellen zugreift, um sein Weltwissen zu erweitern, bevor er antwortet oder handelt.
In unserem KI-Wissensdatenbank-Beispiel haben wir bereits gezeigt, wie ein einfacher RAG-Chatbot funktioniert. Bei Agentic RAG geht es einen Schritt weiter: Der Agent entscheidet eigenständig, wann und wie er Wissensabruf betreibt.
Warum "agentic"?
Das Besondere ist, dass der Agent hier autonom entscheidet, wann er zusätzliche Informationen braucht. Er hat also die "Intelligenz", eigenständig festzustellen: Für diese Aufgabe brauche ich zusätzliche Infos aus Quelle X, und dann die Abfrage auszuführen. Das unterscheidet einen KI-Agenten von einem starren Q&A-System.
Gerade in Unternehmen, wo umfangreiche interne Wissensbestände vorliegen (Datenbanken, Handbücher, Dokumentationen), ist RAG essenziell, damit der Agent faktisch richtige und kontextspezifische Auskünfte geben kann.
Praktisches Beispiel: Technischer Support-Agent
Stellen wir uns einen Agenten im Kundenservice vor, der technische Fragen zu einem Produkt beantwortet. Mit Agentic RAG kann er bei jeder Frage zunächst in der Produktdokumentation und den Support-Tickets suchen.
Fragt ein Kunde beispielsweise: "Hat das Produkt X Feature Y und wie konfiguriere ich das?", könnte der Agent-Workflow so aussehen:
- Analyse: Agent erkennt technische Frage zu spezifischem Produkt
- RAG-Entscheidung: "Ich brauche aktuelle Produktdokumentation"
- Retrieval: Suche in internen Handbüchern nach "Produkt X Feature Y"
- Antwort: Generierung basierend auf gefundenen Dokumenten
- Quellenangabe: Verweis auf die verwendeten internen Artikel
Das Unternehmen stellt so sicher, dass der KI-Agent immer die offizielle, aktuelle Faktenlage verwendet, statt sich etwas auszudenken. Dabei behalten Sie Kontrolle, welche Quellen zugelassen sind (z. B. nur freigegebene Wissensartikel).
Human-in-the-Loop – Menschliche Expertise integriert
Bei aller Autonomie von KI-Agenten bleibt der Mensch im Prozess in vielen Fällen unverzichtbar. Das Pattern Human-in-the-Loop bedeutet, dass bestimmte Schritte im Agenten-Workflow explizit eine menschliche Überprüfung, Freigabe oder Ergänzung vorsehen.
Anstatt ein vollautomatisiertes "Fire-and-Forget"-System zu bauen, gestaltet man den Agenten so, dass er den Menschen mit einbindet, wo es sinnvoll ist – sei es aus Qualitätsgründen, ethischen Überlegungen oder um Fachwissen einzubeziehen.
Wie kann das aussehen?
Approval-Gates: Ein einfaches Beispiel ist ein Agent, der zwar eigenständig einen Vorschlag oder Bericht generiert, diesen aber einem menschlichen Entscheider zur Abnahme vorlegt, bevor endgültig gehandelt wird. Man könnte es als eine Art Halb-Automatisierung bezeichnen: Der Agent erledigt 90% der Arbeit, der Mensch checkt die letzten 10%.
Fallback-Mechanismus: Der Agent versucht eine Anfrage zu beantworten; wenn er sich unsicher ist (z. B. das Modell hat eine geringe Konfidenz) oder eine Richtlinie greift ("bei Budgetanfragen über 10k immer menschliche Rückfrage"), dann wird automatisch an einen Menschen eskaliert.
Interactive Refinement: Human-in-the-Loop kann auch bedeuten, dass der Agent den Nutzer nach zusätzlichen Präferenzen fragt, statt etwas zu raten – also Interaktion zur Klärung nutzt.
Wert für Unternehmen
Dieser Ansatz erhöht die Akzeptanz und Zuverlässigkeit von KI-Lösungen enorm. Entscheider wollen verständlicherweise nicht die Kontrolle komplett abgeben. Mit einem Mensch-in-der-Schleife-Design können Sie KI-Agenten schrittweise Vertrauen entgegenbringen.
Content-Erstellung: Ein Marketing-Agent schreibt automatisch 10 Varianten eines Produkttexts. Ein Redakteur (Mensch) wählt die beste aus und passt Feinheiten an. So werden Produktivität und Qualität kombiniert.
Kritische Entscheidungen: In sensiblen Bereichen könnte ein KI-Agent Vorschläge liefern, aber ein Fachexperte trifft die finale Entscheidung – ähnlich wie medizinische KI-Systeme Ärzte unterstützen, aber nicht ersetzen.
Human-in-the-Loop ist nicht als Rückschritt zu sehen ("die KI kann's nicht alleine"), sondern als Best-of-Both-Worlds-Strategie: KIs sind schnell, konsistent und können Unmengen Daten verarbeiten; Menschen bringen Kontextverständnis, Verantwortung und feines Urteilsvermögen ein.
Kombination der Patterns: Website-Analyse-Agent
Schauen wir uns zur Veranschaulichung einen konkreten Beispiel-Agenten an, der mehrere Patterns kombiniert. Nehmen wir unseren Website-Check per Automation und erweitern ihn:
Planning Phase
Der Agent formuliert zunächst einen Plan:
- HTML und Metadaten laden
- Content-Extraktion ohne JavaScript
- Technische SEO-Prüfung
- KI-Lesbarkeits-Bewertung
- Empfehlungen generieren
Multi-Agent Execution
- Agent A (Technical): Kümmert sich um HTTP-Status, robots.txt, Meta-Tags
- Agent B (Content): Extrahiert und analysiert Textinhalte, Überschriftenstruktur
- Agent C (AI-Readiness): Bewertet KI-Lesbarkeit und semantische Struktur
- Supervisor: Koordiniert die Agenten und fasst Ergebnisse zusammen
Tool Use & CodeAct
- Web-Scraping: HTTP-Requests ohne JavaScript (Tool Use)
- Content-Parsing: Generiert Python-Code zum Extrahieren von
<noscript>
-Inhalten (CodeAct) - SEO-Check: Ruft externe APIs für PageSpeed-Analyse auf (Tool Use)
Agentic RAG
- Wissensbasis: Agent sucht in interner Datenbank nach aktuellen SEO-Guidelines
- Best Practices: Vergleicht Website mit bekannten KI-optimierten Beispielen
Self-Reflection
Nach der ersten Bewertung prüft der Agent:
- Sind alle wichtigen SEO-Faktoren berücksichtigt?
- Stimmen die technischen Messungen?
- Sind die Empfehlungen praktisch umsetzbar?
Human-in-the-Loop
- Kritische Websites: Bei Kunden-Websites wird das Ergebnis vor Versendung von einem SEO-Experten geprüft
- Unsichere Bewertungen: Bei widersprüchlichen Signalen wird automatisch eskaliert
Ergebnis: Ein umfassender Website-Report mit Score, konkreten Verbesserungsvorschlägen und Prioritätseinstufung – deutlich detaillierter als die einfache Version aus unserem ursprünglichen Blogpost.
Modularer Ausbau: Der praktische Weg
Nachdem wir nun die Bandbreite agentischer Patterns kennen, stellt sich die Frage: Wie fängt man praktisch an und wie steigert man die Komplexität über die Zeit?
Für Entscheider ist es wichtig zu wissen, dass man nicht alles auf einmal implementieren muss. Vielmehr lassen sich KI-Agenten schrittweise erweitern:
Stufe 1 – Einfacher Assistent
Starten Sie mit einem einzelnen Agenten für eine klar umrissene Aufgabe. Zum Beispiel ein Q&A-Assistent, der dank Tool Use auf eine interne Wissensdatenbank zugreift.
Verwendete Patterns: ReAct + Tool Use
Nutzen: Erste Automatisierungserfolge, überschaubares Risiko
Beispiel: FAQ-Bot für IT-Support wie in unserem Wissensdatenbank-Beispiel
Stufe 2 – Domain-Integration
Erweitern Sie den Agenten um Retrieval (RAG), damit er firmenspezifisches Wissen einbezieht. Evtl. kommt hier schon eine Planungs-Komponente hinzu.
Nutzen: Antworten werden genauer und kontextbezogener
Beispiel: Support-Agent greift auf Produktdokumentation, Tickets und interne Handbücher zu
Stufe 3 – Komplexe Workflows
Führen Sie einen Planning Agent ein, wenn der Anwendungsfall viele Schritte erfordert. Self-Reflection wird eingebaut für Qualitätskontrolle.
Nutzen: Größere, zusammenhängende Prozesse werden automatisiert
Beispiel: Wie unser Belegverarbeitungs-Workflow, aber mit intelligenter Planung und Fehlerkorrektur
Stufe 4 – Spezialisierung
Bei Bedarf teilen Sie das System auf: mehrere Agenten übernehmen Teilaufgaben, orchestriert durch einen Hauptagenten.
Nutzen: Bessere Performance und Skalierbarkeit bei komplexen Prozessen
Beispiel: Kundenservice-Team aus spezialisierten Agenten
Stufe 5 – Enterprise-Integration
Human-in-the-Loop und Governance werden systematisch eingeführt. Monitoring, Logging und klare Eskalationsregeln etabliert.
Nutzen: Maximale Automatisierung bei gleichzeitiger Kontrolle und Compliance
Was als nächstes?
Die vorgestellten Patterns sind erst der Anfang. KI-Agenten entwickeln sich rasant weiter, und neue Muster entstehen laufend. Für Unternehmen besteht jetzt die Gelegenheit, Schritt für Schritt Erfahrungen mit diesen Systemen zu sammeln.
Wer früh anfängt – zunächst in einem begrenzten Anwendungsfall – wird schneller ein Gefühl dafür bekommen, wo die Potenziale und Grenzen liegen. So lassen sich Einstieg und Ausbau optimal gestalten: Heute vielleicht ein smarter Assistent für das Team, morgen ein Netz aus spezialisierten Agenten, das ganze Geschäftsprozesse automatisiert.
Entscheidend ist, das Big Picture im Auge zu behalten: KI-Agenten sind kein Selbstzweck, sondern ein Werkzeug, um Wert zu schaffen – sei es durch Effizienzsteigerung, schnellere Entscheidungsfindung oder neue Dienstleistungen.
Mit dem richtigen Pattern-Mix und einer klaren Strategie können KI-Agenten zu einem echten Gamechanger für die Prozessoptimierung in Ihrem Unternehmen werden.