Das erste Angebot kam mit 12.000 €. Das zweite Angebot für denselben Workflow kam mit 58.000 €. Beide Zahlen waren korrekt. Das 12.000-€-Angebot deckte den Build ab. Das 58.000-€-Angebot umfasste Integrationsarbeit, eine dreimonatige Support-Periode und laufende Wartung. Das sind nicht dasselbe Produkt.
Die meisten Unternehmen budgetieren für den Build. Integrationsarbeit planen sie selten ein, und laufende Kosten für den Betrieb eines Agents nach dem Launch kaum je. Zu verstehen, was KI-Agent-Implementierung tatsächlich kostet, bevor Sie unterschreiben, verhindert die häufigste Quelle von Implementierungsbedauern: der Agent, der beim Launch funktionierte und in den folgenden Monaten still degradierte.
Was ein Custom-Agent-Build tatsächlich kostet
Build-Kosten werden von zwei Faktoren bestimmt: Workflow-Komplexität und Anzahl der Integrationen.
Workflow-Komplexität misst, wie viel Logik entworfen werden muss, bevor eine Zeile Code geschrieben wird. Ein Workflow mit zwei konsistenten Eingaben, einer Entscheidung und einer Ausgabe ist ein unkomplizierter Build. Ein Workflow mit bedingten Verzweigungen, mehreren Eskalationspfaden und Edge Cases, die separate Behandlung erfordern, vervielfacht die Designzeit. Komplexe Workflows brauchen mehr Prompt-Iterationen, mehr Tests mit realen Eingaben und mehr Zeit, bevor die Ausgabe zuverlässig ist.
Anzahl der Integrationen ist wichtig, weil jedes verbundene Tool Setup, Berechtigungen, Datenmapping und Fehlerbehandlung erfordert. Einen Custom Agent mit einem einzelnen CRM zu verbinden ist eine Aufgabe. Ihn mit einem CRM, einem Posteingang, einem Projekttracker und einem Abrechnungstool zu verbinden ist ein Projekt mit vier separaten Integrationsabhängigkeiten – von denen jede nach dem Launch unabhängig brechen kann.
Für einen einzelnen, klar definierten Workflow mit einer oder zwei Integrationen liegen Build-Kosten typischerweise bei 8.000–25.000 €. Für Multi-Integrations-Systeme mit bedingter Logik und einer vollständigen Kontrollschicht sind 30.000–80.000 € realistisch. Der Build ist der einzige Kostenpunkt mit einem definierten Endpunkt.
Was laufende Wartung tatsächlich umfasst
Prompt-Drift ist die teuerste und schwierigste zu erkennende Wartungskosten. Wenn sich Geschäftssprache oder Prozesslogik ändert — neue Eskalationspfade, geänderte Ausgabeformate, aktualisierte Teamverantwortlichkeiten — arbeitet der Agent weiter gegen Anweisungen, die nicht mehr widerspiegeln, wie das Unternehmen funktioniert. Der Agent scheitert nicht sichtbar. Er produziert Ausgaben, die leicht falsch sind und sich akkumulieren.
Wartung hat drei Kategorien, jede mit einem anderen Kostenprofil.
Prompt-Drift tritt auf, wenn sich Geschäftsprozesse ändern und Agent-Anweisungen nicht aktualisiert werden. Ein Custom Agent, der im Januar für eine Recruiting-Firma gebaut wurde, spiegelt das Intake-Verfahren, die Kandidatenkategorien und den Kundenkommunikationsstil der Firma wider, wie sie im Januar existierten. Bis Oktober haben sich zwei dieser drei Dinge geändert. Der Agent läuft noch. Er läuft gegen einen Schnappschuss des Unternehmens von neun Monaten zuvor. Das Korrigieren von Prompt-Drift erfordert die Überprüfung aller betroffenen Anweisungen, Tests von Updates mit realen Eingaben und Redeployment — oft zwei bis drei Tage Arbeit pro Drift-Ereignis.
Integrations-Drift tritt auf, wenn verbundene Tools ihre APIs aktualisieren oder ihre Datenformate ändern. Shopify, HubSpot, Notion und Gmail aktualisieren ihre APIs jeweils mindestens einmal jährlich. Wenn eine API sich ändert, bricht die Integration entweder sichtbar — der Agent hört auf zu funktionieren — oder unsichtbar, indem er Daten gegen ein Feldmapping verarbeitet, das nicht mehr übereinstimmt. Unsichtbare Brüche sind teurer, weil sie fehlerhafte Ausgaben produzieren, bevor jemand es bemerkt.
Edge-Case-Akkumulation ist der Wartungsaufwand, den die meisten Unternehmen am wenigsten erwarten. Jeder Workflow hat Eingaben, für die er nicht entworfen wurde — unvollständige Eingaben, mehrdeutige Kategorien, widersprüchliche Daten aus zwei verbundenen Systemen. Diese Fälle akkumulieren sich, wenn der Agent mehr reale Daten verarbeitet. Jeder nicht behandelte Edge Case produziert entweder eine fehlerhafte Ausgabe oder wird zur manuellen Überprüfung weitergeleitet. Mit der Zeit wächst das Volumen nicht behandelter Fälle, es sei denn, jemand verwaltet es aktiv.
Warum Jahr zwei mehr kostet als das Build-Jahr
Wartung im ersten Jahr umfasst hauptsächlich Prompt-Drift und Integrationswartung — die erwarteten Kosten, um den Agent mit dem sich ändernden Unternehmen abzustimmen. Jahr zwei fügt akkumulierte Edge Cases zu dieser Basis hinzu.
Budgetieren Sie den Build. Dann budgetieren Sie jedes Jahr danach 30% davon.
Im ersten Jahr werden die meisten Edge Cases in den ersten Betriebsmonaten identifiziert und behandelt. Bis Jahr zwei haben sich die Edge Cases angesammelt, die im ersten Jahr nicht erkannt wurden. Neue Prozessänderungen haben neuen Drift eingeführt. Integrations-Updates haben zwei oder drei Wartungszyklen erfordert. Die Jahr-zwei-Wartungskosten für einen 20.000-€-Build liegen typischerweise bei 4.000–8.000 € — verglichen mit 3.000–6.000 € im ersten Jahr.
Über drei Jahre kostet ein 20.000-€-Build 31.000–42.000 € insgesamt, einschließlich Integrationsarbeit und Wartung. Diese Zahl ist nicht außergewöhnlich — sie ist die erwarteten Kosten für den Betrieb eines Agents, der tatsächlich mit dem Unternehmen übereinstimmt. Unternehmen, die dafür budgetieren, behandeln es als Infrastruktur. Unternehmen, die es nicht tun, behandeln es als Problem.
Wie Scope-Entscheidungen die Gesamtkosten bestimmen
Der wirksamste Weg, die Gesamtkosten eines Custom Agents zu reduzieren, ist die Reduzierung des Scopes in der Briefing-Phase. Ein enger, gut dokumentierter Workflow kostet weniger zu bauen, weniger zu integrieren und weniger zu warten. Ein breiter Workflow mit mehreren Teilprozessen kostet mehr in allen drei Kategorien.
Die wichtigste Scope-Entscheidung ist die Dokumentationstiefe. Ein Workflow, der als "Client-Onboarding-E-Mails bearbeiten" beschrieben wird, ist ein breiter Scope mit undefinierten Edge Cases, mehrdeutiger Eskalationslogik und keinem festgelegten Ausgabeformat. Ein Workflow, der als "Antwort auf eingehende Onboarding-E-Mails von neuen Clients entwerfen, unter Bezugnahme auf ihren spezifischen Plan-Tier aus HubSpot, und den Entwurf zur Überprüfung in Slack vorlegen" beschrieben wird, ist ein enger Scope mit klaren Eingaben, einer definierten Ausgabe und einer Integrationsabhängigkeit.
Enge Scopes produzieren schnellere Builds, zuverlässigere Prompts und weniger Edge Cases in der Produktion. Sie kosten auch weniger zu warten — weil die Domain möglicher Eingaben kleiner ist und die Logik einfacher zu aktualisieren ist, wenn sich Prozesse ändern. Eng bauen und gezielt erweitern ist günstiger als breit bauen und kontinuierlich debuggen.
Für Kontext, welcher Workflow zuerst automatisiert werden sollte, siehe Wie man erkennt, ob ein Geschäftsprozess bereit ist, an einen Agent übergeben zu werden. Für den vollständigen Build-Prozess, siehe Wie man einen Custom Agent baut.
Häufig gestellte Fragen
Was kostet ein Custom Agent? Build-Kosten liegen bei 8.000–25.000 € für einen einzelnen, klar definierten Workflow mit einer oder zwei Integrationen. Multi-Integrations-Systeme mit bedingter Logik liegen bei 30.000–80.000 €. Integrationsarbeit kommt mit 20–40% obendrauf. Laufende Wartung kostet 15–30% der Build-Kosten pro Jahr, wobei Jahr zwei typischerweise höher ist als Jahr eins. Budgetieren Sie alle drei Kosten vor der Unterschrift.
Was kostet Custom-Agent-Wartung pro Jahr? Planen Sie 15–30% der ursprünglichen Build-Kosten pro Jahr ein. Ein 20.000-€-Build kostet 3.000–6.000 € in Jahr eins und 4.000–8.000 € in Jahr zwei, wenn Edge Cases sich ansammeln und weitere Drift-Ereignisse auftreten. Diese Zahlen setzen voraus, dass der Agent aktiv gewartet wird — ein Agent ohne Wartung degradiert über die Zeit.
Was ist Prompt-Drift? Prompt-Drift tritt auf, wenn sich Geschäftsprozesse ändern, aber Agent-Anweisungen nicht aktualisiert werden. Der Agent arbeitet weiter gegen Anweisungen, die für eine frühere Version des Workflows geschrieben wurden. Er scheitert nicht sichtbar — er produziert Ausgaben, die subtil falsch sind und sich kompoundieren. Das Korrigieren eines Drift-Ereignisses dauert typischerweise zwei bis drei Tage.
Wie kann ich die Gesamtkosten eines Custom Agents reduzieren? Engen Scope in der Briefing-Phase festlegen. Ein gut dokumentierter Single-Process-Workflow kostet weniger zu bauen, zu integrieren und zu warten als ein breiter Scope, der mehrere Teilprozesse abdeckt. Die gesamten Dreijahreskosten eines engen Builds sind typischerweise 40–60% niedriger als ein breiter Build, der dieselbe zugrunde liegende Domain abdeckt.
Quellen
- Anthropic, Building effective agents, 2024. https://www.anthropic.com/research/building-effective-agents