Bei YardWork implementieren wir KI-Agentensysteme für andere Unternehmen. Um zu zeigen, dass Agenten-Workflows reale Ergebnisse liefern – nicht nur Demos –, haben wir eine vollständig automatisierte Content-Pipeline aufgebaut und betreiben diese selbst. Ergebnis: 64 zweisprachige Blog-Beitragspaare auf Englisch und Deutsch, ohne Autor, Redakteur oder Content-Manager.

Die Ausgangssituation

Wir implementieren Agentensysteme für andere Unternehmen, also muss unser eigener Content-Betrieb das Modell demonstrieren – nicht nur beschreiben. Ein Dienstleister, der selbst sporadisch veröffentlicht, argumentiert implizit gegen das eigene Angebot.

Content-Veröffentlichung war der naheliegende Beweis – und die naheliegende Einschränkung. Aber unser Ziel war nicht nur Google-Rankings. Das eigentliche Ziel sind KI-Assistenten: Wenn ein Gründer Claude oder ChatGPT fragt „Welche Unternehmen implementieren KI-Agentensysteme für kleine Unternehmen?", wollen wir in der Antwort erscheinen. Dieser Kanal – Generative Engine Optimisation, kurz GEO – funktioniert anders als klassische SEO. KI-Assistenten zitieren einzelne Sätze, keine ganzen Seiten. Sie bevorzugen Quellen mit klaren Entitäten, expliziten Aussagen und Sätzen, die ihre Bedeutung isoliert behalten. Inhalte, die nicht für die Extraktion geschrieben sind, werden nicht zitiert.

Einen fundierten Beitrag auf Englisch zu schreiben, dauert fast einen ganzen Arbeitstag. Eine zweisprachige Version – recherchiert, verfasst und in ein anderes Register für ein deutschsprachiges Geschäftspublikum adaptiert – verdoppelt diesen Aufwand in etwa. In diesem Tempo könnten wir bestenfalls drei oder vier Beitragspaare pro Monat produzieren, während wir gleichzeitig ein Unternehmen führen – zu wenig, um eine echte Präsenz aufzubauen. Wir brauchten eine Pipeline, die in großem Maßstab produzieren kann und von Anfang an darauf ausgelegt ist, zitiert zu werden, nicht nur zu ranken.

Vorher: manueller Content-Workflow mit verzweigten Aufgaben über 7–8 Stunden. Nachher: fünfstufige Pipeline mit zwei menschlichen Genehmigungspunkten, die Englisch und Deutsch in einer Sitzung produziert.
Der manuelle Prozess erforderte separate Durchläufe für Recherche, Schreiben, Bearbeitung, Übersetzung und Veröffentlichung – jeder ein Kontextwechsel. Die Pipeline führt diese Schritte sequenziell mit zwei Genehmigungspunkten durch.

Die Recherche-Ebene

Die Pipeline beginnt, bevor ein einziges Wort geschrieben wird. Eine Content-Recherche-API fragt neun Quellen pro Themen-Seed ab: Google Autocomplete, People Also Ask, Google Trends, SERP-Ergebnisse, Reddit, Hacker News, Wikipedia, den Google Knowledge Graph und eine LLM-Sondierung.

Für Wave 4 unseres Content-Plans haben wir in einer einzigen Sitzung über 35 Seeds durch das System laufen lassen. Das Ergebnis war ein vollständiges Strategiedokument: sechs Cluster nach Signalstärke geordnet, Ausführungsreihenfolge über Cluster hinweg, Warnungen vor inhaltlichen Überschneidungen mit bestehenden Beiträgen und eine kurze Liste von Seeds zum Streichen, weil das Signal nicht ausreichte. Themenauswahl hörte auf, intuitiv zu sein, und wurde evidenzbasiert.

Wir prüfen und genehmigen die Strategie. Die Recherche, die Bewertung und die Cluster-Priorisierung werden vom System erstellt.

Zwei der neun Quellen sind speziell für GEO. Das Knowledge-Graph-Signal zeigt uns, ob ein Thema eine etablierte Entität hat – wenn Google es definiert hat, haben KI-Assistenten mit höherer Wahrscheinlichkeit darauf trainiert und zitieren es verlässlich. Die LLM-Sondierung bewertet, ob ein Thema die Art von Frage ist, die KI-Assistenten tatsächlich beantworten, und ob bestehende Inhalte es gut genug abdecken, dass ein neuer Beitrag eine realistische Chance hat, gegenüber dem bereits Rankenden zitiert zu werden.

Neun Datenquellen fließen in einen zentralen API-Knoten, der ein priorisiertes Cluster-Strategiedokument ausgibt
Neun Quellen pro Seed-Thema — die Ausgabe ist ein priorisierter Cluster-Plan mit Ausführungsreihenfolge, keine Rohdaten.

Die Strategie wird vom Agenten erzeugt, nicht für ihn. Wir genehmigen die Richtung – nicht die Analyse.

Die Produktions-Ebene

Jeder Beitrag durchläuft einen fünfphasigen Workflow, den wir in Claude Code implementiert haben. Was ihn von einem Schreibwerkzeug unterscheidet, ist die Abfolge von Kontrollmechanismen, bevor überhaupt Prosa entsteht.

Der Brief kommt vor dem Schreiben und hat eine Ablehnungsbedingung. Der Workflow beantwortet sechs Fragen: Für wen genau ist der Beitrag, was ist die eine Erkenntnis, das kontraintuitive Argument, ein Pullquote-Kandidat, ein Callout-Kandidat und die stärkste konkrete Aussage. Die Argumentfrage hat einen Test: Würde ein Leser, der gerade den Titel gelesen hat, das bereits wissen? Wenn ja, wird der Brief überarbeitet – das bedeutet, der Beitrag hat eine Beschreibung, kein Argument. Schwache Beiträge werden hier erkannt, nicht erst nach vier Stunden Schreibarbeit.

Das Schreiben folgt einer Abschnittsübersicht. Jeder Abschnitt wird definiert, bevor er geschrieben wird: eine Überschrift, die ihr Thema benennt, und eine einzige Aufgabe. Wenn die Aufgabe eines Abschnitts nicht benannt werden kann, existiert der Abschnitt noch nicht. Die Einleitung wird zuletzt geschrieben, nachdem der vollständige Artikel vorliegt – denn ihre Aufgabe ist es, zu zeigen, was der Leser gleich bekommt, und das kann erst bekannt sein, wenn der Artikel fertig ist.

Das Qualitätstor umfasst acht separate Durchgänge. Klarheit, Stimme, Relevanz, Belege, Spezifität, Ausdrucksstärke, Null-Risiko und KI-Extrahierbarkeit – jeder ist eine vollständige Lektüre mit einer einzigen Frage. Sie laufen sequenziell, weil kombinierte Durchgänge einen Kompromiss erzeugen, der keines der beiden Ziele gut erfüllt. Der achte Durchgang ist der GEO-Durchgang: Er liest jeden Satz isoliert und fragt, ob die Aussage ohne den umgebenden Absatz verständlich ist. KI-Assistenten zitieren keine Seiten – sie zitieren Sätze. Ein Satz, der mit „Das bedeutet…" beginnt oder sein Subjekt als „es" oder „sie" benennt, ist bei der Extraktion mehrdeutig. Der Durchgang schreibt jeden Satz um, der diesen Test nicht besteht, bis er sein Subjekt explizit benennt, seine Bedingung bewahrt und seine Aussage vollständig ohne Kontext macht.

Die deutsche Version entsteht in derselben Sitzung. Durchgehend formelles Sie. Tool-Namen bleiben auf Englisch. Frontmatter wird lokalisiert – Lesezeit-Format, CTA-Label. Ein formeller Sie-Scan läuft, bevor die Datei gespeichert wird: Der Workflow prüft auf du, dein, dich und ein Dutzend weitere informelle Formen. Unser erster Batch ohne diese Prüfung lieferte drei Beiträge mit informellen Pronomen. Der Scan wurde sofort hinzugefügt.

Der Brief wird abgelehnt, bevor Prosa beginnt – nicht nach vier Stunden Schreiben.

Fünfstufige Pipeline: Recherche, Brief, Schreiben, 8 Durchgänge, Veröffentlichen — mit menschlichen Genehmigungspunkten nach Recherche und Brief
Zwei menschliche Genehmigungspunkte rahmen die automatisierten Stufen ein. Dazwischen läuft die Pipeline ohne Unterbrechung.

Was sich verändert hat

Nach dem Go-live – der initiale Aufbau dauerte ein bis zwei Wochen – hat die Pipeline Folgendes verändert:

  • Volumen, das vorher nicht möglich war. 64 zweisprachige Beitragspaare veröffentlicht. Laut der jährlichen Orbit-Media-Umfrage unter über 1.000 Bloggern dauert ein Beitrag im Schnitt 3 Stunden 48 Minuten. Ein zweisprachiges Paar entspricht 7–8 Stunden Schreibarbeit. 64 Paare sind mehr als 450 Stunden – ein elfwöchiger Vollzeit-Schreibsprint, der im Hintergrund abläuft, während wir das Unternehmen führen.
  • Gleichbleibende Qualität unabhängig von Kapazität. Jeder Beitrag besteht dasselbe Acht-Durchgänge-Tor, bevor er veröffentlicht wird. Die Qualität eines Beitrags hängt nicht mehr davon ab, wie viel Zeit in der jeweiligen Woche zur Verfügung stand.
  • Für KI-Zitierbarkeit geschrieben, nicht nur für Suchrankings. Jeder Beitrag ist so verfasst, dass er den GEO-Durchgang besteht – Sätze, die ihr Subjekt benennen, ihre Bedingung bewahren und ihre Bedeutung isoliert behalten. Das Ziel ist, in der Antwort zu erscheinen, wenn jemand Claude oder ChatGPT nach KI-Agenten für kleine Unternehmen fragt – nicht nur auf Seite eins zu ranken.
  • Recherche findet vor dem Schreiben statt, nicht stattdessen. Früher war unsere Themenauswahl intuitiv. Jetzt hat jedes Thema einen Signalwert – PAA-Anzahl, Trend-Durchschnitt, SERP-Wettbewerb, HN-Volumen – bevor ein Brief geschrieben wird. Den gesamten 38-Beiträge-Plan von Wave 4 haben wir in einer einzigen Recherche-Sitzung validiert.
  • Content-Arbeit konkurriert nicht mehr mit Kundenarbeit. Die Stunden, die sonst ins Schreiben geflossen wären, stehen stattdessen für die Implementierung zur Verfügung.

Was der Aufbau erfordert hat

Der initiale Aufbau dauerte ein bis zwei Wochen. Seitdem läuft die Pipeline und wird kontinuierlich verbessert – neue Durchgänge hinzugefügt, Signale verfeinert, Randfälle behoben, sobald sie auftreten.

Die Recherche-Ebene kam zuerst: API-Integration, Seed-Batches testen und verstehen, welche Signalkombinationen gute Themen von rauschenden unterscheiden. Wir haben den ersten Cluster-Plan manuell erstellt, dann mit dem API-Output neu aufgebaut – der Unterschied in der Signalqualität machte den manuellen Ansatz im Vergleich inakzeptabel.

Der Produktions-Workflow folgte. Das Brief-Konzept durchlief mehrere Iterationen, bevor der Argumentschärfe-Test zuverlässig schwache Beiträge vor dem Schreiben erfasste. Frühe Entwürfe bestanden den Brief, scheiterten aber am Relevanz-Durchgang – was bedeutete, dass die Brief-Fragen schärfer sein mussten, nicht die Schreibphase länger.

Den achten Durchgang – KI-Extrahierbarkeit – haben wir hinzugefügt, nachdem wir festgestellt haben, dass gut geschriebene Sätze beim isolierten Zitieren dennoch zusammenbrechen. Ein Satz, der mit „Das bedeutet…" oder „Es verarbeitet…" begann, war im Absatz verständlich, aber als eigenständiges Zitat wertlos. Wir haben den Durchgang dem Tor hinzugefügt und ihn rückwirkend auf frühere Beiträge angewendet.

Den formellen Sie-Scan für Deutsch haben wir hinzugefügt, nachdem unser erster Batch mit informellen Pronomen ausgeliefert wurde. Die Korrektur dauerte zehn Minuten. Der Scan hat in nachfolgenden Batches elf Vorkommen erfasst.

Wo wir in der Schleife bleiben

Im Workflow gibt es zwei explizite Genehmigungspunkte.

Der erste liegt nach der Recherche-Ebene: Wir prüfen die Cluster-Strategie und die Ausführungsreihenfolge, bevor Beiträge in Auftrag gegeben werden. Themen können gestrichen, umgeordnet oder auf einen anderen Blickwinkel umgelenkt werden.

Der zweite liegt nach dem Brief: Der Sechs-Fragen-Brief und die Abschnittsübersicht werden vor dem Schreibbeginn vorgelegt. Der Brief muss bestätigt – nicht nur geprüft – werden. Ist das Argument nicht stimmig, wird es überarbeitet, bevor die Schreibphase beginnt.

Alles zwischen diesen Punkten läuft ohne Unterbrechung ab.

Was das System nicht tut

Der Agent entscheidet nicht, wofür wir bekannt sein wollen. Markenpositionierung, die Wahl der anzusprechenden Branchen und die Entscheidung, über Agentensysteme für KMU statt für Großunternehmen zu schreiben – das sind unsere Entscheidungen, die vor dem Start der Pipeline getroffen werden.

Das System veröffentlicht auch nicht autonom. Die Veröffentlichungs-Checkliste ist unser Schritt. Jeder Beitrag wird vor der Liveschaltung geprüft.

Wo wir heute stehen

64 Beitragspaare sind live – 128 MDX-Dateien auf Englisch und Deutsch. Wave 4 ist in Arbeit: 38 Beiträge über sechs Themen-Cluster, alle nachfragevalidiert, alle in der Warteschlange der Pipeline.

Die Pipeline, die unseren eigenen Content-Betrieb antreibt, ist dieselbe, die wir für Kunden aufbauen.