Die meisten KI-Agenten-Projekte scheitern nicht beim Aufbau — sie stagnieren nach dem Launch, wenn die Zuständigkeit wegfällt. Der Implementierungspartner schließt das Projekt ab. Der interne Verantwortliche kehrt zu seinen regulären Aufgaben zurück. Der Agent läuft weiter, aber niemand schaut hin. Drei Monate später hat die Ausgabequalität nachgelassen und das Team erledigt den Workflow wieder manuell.

Drei Monate nach dem Launch läuft der Agent noch. Der Workflow, den er übernimmt, wird nicht mehr manuell bearbeitet. Nach jedem sichtbaren Maßstab war das Projekt erfolgreich. Dann erwähnt ein Kunde eine E-Mail, die nicht ganz stimmte. Der Agent produziert seit sechs Wochen fehlerhafte Ausgaben bei einer bestimmten Eingabekategorie — die Implementierung wurde ohne Verantwortlichen zurückgelassen, und das ist eine andere Art von Misserfolg.

Wie die ersten neunzig Tage aussehen

Die ersten drei Monate einer KI-Agenten-Implementierung haben eine konsistente Struktur. Das Ziel ist klar: diesen Workflow bis zu diesem Datum zum Laufen bringen. Die Zuständigkeit ist benannt: die Person, die das Projekt vorangetrieben hat. Der Fortschritt ist sichtbar — Aufbauten, Tests, Integrationen, die nacheinander live gehen.

Am neunzigsten Tag haben die meisten Implementierungen den Launch abgeschlossen. Der Agent läuft. Der Workflow wird nicht mehr manuell erledigt. Das Projekt ist nach jedem vernünftigen Maßstab ein Erfolg.

Was sich am Tag nach dem Launch ändert

Der Launch ist der Moment, an dem der Implementierungspartner das Projekt als abgeschlossen betrachtet. Dokumentation wird übergeben, eine abschließende Prüfung durchgeführt, und der Partner wechselt zum nächsten Engagement. Der interne Verantwortliche — die Person, die das Projekt vorangetrieben hat — kehrt zu seinen regulären Aufgaben zurück. Der Agent beginnt, selbstständig zu laufen.

Ein paar Wochen lang geht nichts schief. Der Agent übernimmt den Workflow. Die Ausgaben sehen richtig aus. Niemand schaut sich die Protokolle genau an. Das Unternehmen hat andere Prioritäten.

Die Lücke, die das erzeugt, ist nicht dramatisch. Die Lücke ist strukturell. Der Implementierungspartner ist nicht mehr verantwortlich. Der interne Verantwortliche prüft nicht nach. Niemands Aufgabe ist es, den Agenten zu überwachen.

Der Agent bricht nicht zusammen. Niemand ist dafür zuständig, ihn am Laufen zu halten.

Wie Agenten ohne aktive Verantwortung degradieren

Drift ist kein Absturz. Der Agent läuft weiter, produziert weiterhin Ausgaben, sieht weiterhin aus, als würde er funktionieren. Die Fehler sind klein und unsichtbar — bis sie es nicht mehr sind. Bis jemand bemerkt, dass der Agent fehlerhafte Ausgaben produziert, sind bereits wochenlang schlechte Ergebnisse herausgegangen.

Agenten brechen nicht auf offensichtliche Weise zusammen. Agenten degradieren graduell durch drei Fehlermuster, die schwer zu bemerken sind, bis sie eine Weile angehalten haben.

Prompt-Drift tritt auf, wenn sich das Unternehmen verändert, die Anweisungen des Agenten aber nicht. Das Team beginnt, andere Bezeichnungen für Deal-Phasen zu verwenden. Ein Produkt wird umbenannt. Ein neuer Kundentyp taucht auf, für den der Agent nicht ausgelegt war. Der Agent läuft weiter — aber die Ausgaben des Agenten spiegeln die alte Version des Unternehmens wider.

Integrations-Drift tritt auf, wenn verbundene Tools ihre APIs aktualisieren oder ihre Datenstrukturen ändern. Die Verbindung des Agenten zu diesen Tools degradiert still. Ausgaben werden nicht mehr korrekt protokolliert. Datensätze werden nicht mehr aktualisiert. Der Workflow scheint zu laufen, aber der nachgelagerte Effekt fehlt.

Randfall-Akkumulation tritt auf, wenn neue Eingaben ankommen, für die der Agent nicht gebaut wurde. Der Agent verarbeitet diese Eingaben so gut es geht — meistens falsch. Ohne jemanden, der Protokolle prüft, häufen sich diese Fälle unbemerkt an.

Wie die Neunzig-Tage-Klippe in der Praxis aussieht

Das Fehlermuster ist konsistent genug, dass es erkennbare Varianten hat — jede durch eine andere Kombination von Drift-Mechanismen verursacht.

Die Agentur, die ihrem Agenten allmählich aufgehört hat zu vertrauen. Der Agent wurde gebaut, um Status-Update-E-Mails für aktive Kundenprojekte zu entwerfen. Beim Launch entwarf der Agent Updates, die das Account-Team mit kleineren Korrekturen versendete. Bis Monat drei schrieb das Account-Team 60 % der Entwürfe vor dem Senden um. Niemand kennzeichnete das als Agentenversagen — das Team hatte eine informelle Gewohnheit entwickelt, die Ausgaben zu korrigieren. Bis Monat fünf verfasste das Team die E-Mails wieder manuell. Der Agent wurde nie abgeschaltet. Er wurde einfach nicht mehr genutzt.

Die Beratungsfirma, deren CRM-Daten unzuverlässig wurden. Der Agent wurde gebaut, um Besprechungsnotizen aus E-Mails ins CRM zu protokollieren. Das CRM aktualisierte sein Schema zweimal in den sechs Monaten nach dem Launch. Der Agent lief weiter — schrieb aber in veraltete Felder. Nach Monat vier zeigten Pipeline-Berichte unvollständige Daten. Die Untersuchung dauerte zwei Wochen. Die Datenkorrektur einen weiteren Monat.

Der Gründer, der drei neue Dienstleistungen hinzufügte. Der Agent bearbeitete Follow-ups für Interessenten-Anfragen. Drei Monate nach dem Launch führte der Gründer zwei neue Servicetarife ein. Der Agent antwortete weiterhin, als gäbe es nur den ursprünglichen Service — weil das der Brief beschrieb. Acht Wochen lang erhielten Interessenten, die nach den neuen Services fragten, Follow-ups, die diese nicht erwähnten.

In jedem dieser Fälle lief der Agent. Das Versagen war unsichtbar, bis jemand genau hinschaute. Als jemand genau hinschaute, hatte sich das Problem bereits wochenlang aufgebaut.

Was aktive Verantwortung tatsächlich erfordert

Einen Agenten zu betreiben ist nicht dasselbe wie ihn zu deployen. Ein Agent in der Produktion braucht regelmäßige Aufmerksamkeit: Protokollprüfungen, um Fehlausgaben zu erkennen, Prompt-Aktualisierungen, wenn sich das Unternehmen verändert, Integrationsprüfungen nach Updates verbundener Tools und einen definierten Prozess für Ausnahmen außerhalb des Agentendesigns.

Für die meisten Implementierungen eines einzelnen Workflows sind das ein paar Stunden pro Monat — keine Vollzeitstelle. Das Problem ist nicht das Aufgabenvolumen. Das Problem ist, dass niemand die Aufgabe besitzt. Wenige Stunden undefinierter Verantwortung sind dasselbe wie null Stunden.

VerantwortungsstatusWie es aussiehtErgebnis in Monat sechs
Benannter Verantwortlicher, definierter RhythmusMonatliche Log-Prüfung, Prompt-Updates nach Prozessänderungen, Integrations-Checks nach Tool-UpdatesAgent performt auf oder nahe Launch-Qualität
Informelle Verantwortung ("Team" verantwortlich)Reviews passieren, wenn jemand Zeit hat; Prompt-Updates nur bei sichtbaren ProblemenDrift sammelt sich an; Team hat informelle Workarounds; Agentenausgabe teilweise vertraut
Keine VerantwortungAgent läuft ohne Review; Wartung nur als Reaktion auf BeschwerdenDeutliche Ausgabedegradierung; Team korrigiert manuell oder gibt den Agenten auf

Wie man die Klippe vor dem Launch verhindert

Die Neunzig-Tage-Klippe lässt sich verhindern, aber nur vor dem Launch. Nach dem Start der Implementierung wirkt das Zuweisen von Verantwortung wie das Hinzufügen einer Aufgabe, um die niemand gebeten hat. Vor dem Launch ist das Zuweisen von Verantwortung Teil des Plans.

Zwei Entscheidungen verhindern die Klippe. Benennen Sie den Verantwortlichen vor dem Launch — nicht "das Team", sondern eine konkrete Person, deren Aufgaben die Überprüfung der Agentenleistung und die Aktualisierung des Agentenverhaltens bei Unternehmensveränderungen einschließen. Definieren Sie den Überprüfungsrhythmus: einen konkreten Zeitplan — monatlich reicht für die meisten Implementierungen — um Protokolle durchzugehen, den Integrationsstatus zu prüfen und alles zu kennzeichnen, das Anpassungen braucht.

Beide Entscheidungen brauchen zehn Minuten. Keine davon erfolgt automatisch nach dem Launch.

Die Übergabe vom Implementierungspartner an den internen Verantwortlichen ist der risikoreiche Moment jedes Agenten-Deployments. Eine strukturierte Übergabe verhindert die Wissenslücke, die den internen Verantwortlichen unfähig lässt, das zu warten, was gebaut wurde.

Das Ausnahme-Log und bekannte Edge Cases dokumentieren

Vor der Übergabe sollte der Implementierungspartner jeden Eingabetyp kompilieren, der aus dem Agentenscope ausgeschlossen wurde, jedes während des Testings gesehene Ausnahmemuster, und den manuellen Prozess, der jede Ausnahme derzeit abdeckt. Der neue Verantwortliche muss wissen, was der Agent nicht zu behandeln ausgelegt ist — nicht nur, was er zu behandeln ausgelegt ist.

Die Review-Checkliste etablieren

Die vier Punkte dokumentieren, die einen monatlichen Review ausmachen: Log-Sampling (wie viele Ausgaben zu ziehen, wonach zu suchen), Prompt-Vergleich (wie aktuelle Anweisungen gegen aktuelle Prozesssprache zu vergleichen), Integrations-Gesundheitscheck (welche Systeme stichprobenartig zu prüfen, welche Datensätze zu verifizieren) und Ausnahmen-Review (wie vom Agenten markierte Eingaben zu verarbeiten sind). Die Checkliste sollte spezifisch genug sein, dass jemand, der mit dem Build nicht vertraut ist, den Review durchführen kann.

Den Review-Kalender vor dem Launch-Tag festlegen

Die ersten drei monatlichen Reviews vor dem Abschluss des Engagements des Implementierungspartners einplanen. Der erste Review in Monat eins legt die Baseline fest. Der zweite in Monat zwei erkennt frühen Drift. Der dritte in Monat drei adressiert die Muster, die auftauchen, wenn sich das echte Eingabevolumen aufbaut. Vor dem Launch geplante Reviews finden statt. Reviews, die nach dem Launch geplant werden sollen, finden oft nicht statt.

Den Update-Trigger definieren

Dokumentieren, welche Prozessänderungen ein Prompt-Update erfordern. Nicht jede Unternehmensänderung erfordert ein Prompt-Update, aber der interne Verantwortliche sollte diejenigen erkennen können, die es tun: wenn ein Produkt umbenannt wird, wenn eine neue Kundenkategorie hinzugefügt wird, wenn das Team ändert, wie es eine Workflow-Phase beschreibt. Diese Erkennung sollte dokumentiert, nicht angenommen werden.

Häufig gestellte Fragen

Warum geraten die meisten KI-Agenten-Projekte nach neunzig Tagen ins Stocken?

Die Neunzig-Tage-Klippe entsteht, wenn die Zuständigkeit nach dem Launch wegfällt. Der Implementierungspartner schließt das Projekt ab, der interne Verantwortliche kehrt zu seinen regulären Aufgaben zurück, und niemand ist mehr damit beauftragt, Protokolle zu prüfen, Prompts zu aktualisieren oder Randfälle zu behandeln. Der Agent läuft weiter, degradiert dabei aber still.

Was ist Prompt-Drift bei einem KI-Agenten?

Prompt-Drift tritt auf, wenn sich das Unternehmen verändert, die Anweisungen des Agenten aber nicht. Neue Deal-Phasen, umbenannte Produkte oder neue Kundentypen kommen hinzu — der Agent läuft weiterhin auf dem ursprünglichen Briefing und produziert Ausgaben, die eine veraltete Version des Workflows widerspiegeln.

Wie verhindert man, dass ein KI-Agenten-Projekt ins Stocken gerät?

Benennen Sie vor dem Launch einen konkreten Verantwortlichen — eine bestimmte Person, die monatliche Protokollprüfungen, Prompt-Aktualisierungen und Integrationschecks übernimmt. Die meisten Einzelworkflow-Agenten erfordern nur wenige Stunden Wartung pro Monat. Das Problem ist nicht das Arbeitsvolumen, sondern das Fehlen einer verantwortlichen Person.

Was ist Integrations-Drift bei einem KI-Agenten?

Integrations-Drift tritt auf, wenn verbundene Tools nach dem Launch ihre APIs aktualisieren oder Datenstrukturen ändern. Die Verbindungen des Agenten degradieren still — Ausgaben werden nicht mehr korrekt protokolliert, Datensätze nicht mehr aktualisiert — während der Workflow scheinbar normal weiterläuft.

Was sollte vor der Übergabe der Verantwortung an einen internen Wartungsverantwortlichen übergeben werden? Die Übergabe sollte umfassen: ein kompiliertes Ausnahme-Log, das jeden aus dem Scope ausgeschlossenen Eingabetyp und den manuellen Prozess, der ihn abdeckt, auflistet; eine dokumentierte monatliche Review-Checkliste, die spezifisch genug ist, dass jemand Neues sie befolgen kann; die ersten drei monatlichen Review-Termine bereits geplant; und eine Trigger-Liste, die dokumentiert, welche Unternehmensänderungen ein Prompt-Update erfordern. Ohne diese erbt der Wartungsverantwortliche ein System ohne das Wissen, es zu warten.

Was ist das früheste Anzeichen dafür, dass ein Agent sich der Neunzig-Tage-Klippe nähert? Das früheste beobachtbare Anzeichen ist in der Regel, dass das Team informelle Workarounds rund um die Ausgaben des Agenten entwickelt — bestimmte Ausgabetypen konsequent vor dem Versand bearbeitet, die Ausgabe des Agenten für eine bestimmte Eingabekategorie überspringt oder Eingaben manuell behandelt, die früher durch den Agenten liefen. Diese Workarounds erscheinen, bevor das Team ein Problem mit dem Agenten artikuliert, weil sie schneller zu entwickeln sind als eine formelle Eskalation. Wenn das Team sechs bis acht Wochen nach dem Launch konsistente Workarounds hat, benötigt der Agent einen Review.

Kann ein Agent, der bereits ins Stocken geraten ist, wiederhergestellt werden? Ja, aber die Arbeit ist aufwändiger als die Wartung, die das Stocken verhindert hätte. Die Wiederherstellung umfasst ein vollständiges Audit: den aktuellen Prompt gegen den aktuellen Geschäftsprozess ziehen, um zu identifizieren, was gedriftet ist; jede Integrationsverbindung auf Schema- und Berechtigungsänderungen prüfen; das Ausnahme-Log auf Muster überprüfen, die sich seit dem Launch angesammelt haben. Für einen Agenten, der drei bis vier Monate ohne Wartung gelaufen ist, dauert dieses Audit typischerweise vier bis sechs Stunden. Der laufende monatliche Review, der das Stocken verhindert hätte, dauert zwei bis drei Stunden pro Monat.