Bei YardWork implementieren wir KI-Agentensysteme für andere Unternehmen. Eine schlanke Agentur bat uns um eine Outbound-Sales-Pipeline, die Prospects recherchieren, maßgeschneiderte E-Mails verfassen, versenden und Follow-ups verfolgen kann — ohne CRM oder Vollzeit-Vertriebsmitarbeiter. Wir lieferten einen agentengesteuerten Workflow, bei dem die KI die Recherche, den Lead-Import und die Sequenzerstellung übernimmt — der Mensch prüft und genehmigt nur vor den entscheidenden Schritten. Das Ergebnis: 1.000 erreichte Prospects mit einer positiven Rücklaufquote von 4 %.

1.000Erreichte Prospects
4%Positive Rücklaufquote

Die Herausforderung

Eine schlanke Professional-Services-Agentur betrieb Outbound-Sales so, wie es jedes kleine Team tut: manuell. Wenn ein Gründer einen vielversprechenden Prospect identifizierte, recherchierte er das Unternehmen, schrieb eine personalisierte E-Mail, versendete sie und versuchte, sich eine Woche später an das Follow-up zu erinnern. Jeder neue Prospect bedeutete eine weitere Rechercherunde. Jedes Follow-up hing davon ab, wer sich gerade an die Tabelle erinnerte.

Das Team wusste, dass personalisierte Ansprache besser funktioniert als Vorlagen — aber sie dauerte zu lange. Die Recherche eines einzelnen Prospects dauerte 15–20 Minuten. Das Verfassen einer wirklich maßgeschneiderten E-Mail weitere 20. Bei mehreren ICPs und Dutzenden zu erreichenden Prospects verbrauchte der manuelle Prozess Stunden, die für die Kundenarbeit gedacht waren. Das Volumen war durch die Zeit begrenzt, nicht durch die Gelegenheit.

Vorher: manuelle Recherche, Erstellung und Nachverfolgung verteilt über Browser-Tabs und eine Tabelle. Nachher: einzelne Pipeline für Recherche, Bewertung, Erstellung und Follow-ups.
Der manuelle Prozess erforderte separate Durchläufe für Recherche, Erstellung und Follow-up-Tracking — jeder ein Kontextwechsel. Die Pipeline führt sie sequenziell mit einem menschlichen Prüfpunkt aus.

Die Lösung

Wir bauten eine Agent-Pipeline, die den gesamten Outbound-Workflow abdeckt — von der Zielgruppenbestimmung über den Versand bis zum Follow-up — mit einem menschlichen Prüfpunkt in der Mitte.

Zielgruppenbestimmung und Recherche. Der Agent beginnt mit drei ICP-Hypothesen — Personalvermittlungsfirmen, boutique B2B-Dienstleister und Distributoren — und bewertet Prospects nach firmografischer Passung und Kaufsignalen. Frühe Versionen gewichteten theoretische Passung zu stark (Unternehmensgröße, Tech-Stack, Einstellungsmuster) und aktive Kaufabsicht zu schwach. Wir vereinfachten auf drei Fragen: Hat dieser Prospect das Problem, hat er Budget und sucht er aktiv? Alles andere wurde nebensächlich.

Die Prospects werden über API-basierte Jobbörsen-Suchen und direkte Recherche gewonnen. Jeder Eintrag wird verifiziert, bevor er in die Pipeline aufgenommen wird — 29 % der beschafften Leads waren bereits veraltet. Die Verifizierung läuft vor der Bewertung, nicht danach.

Der Mensch prüft und genehmigt die Zielliste. Die Recherche, die Verifizierung und die Priorisierung werden vom Agent durchgeführt.

Die Bewertung wurde nicht vereinfacht, weil Komplexität unnötig ist — sondern weil die falsche Art von Komplexität das einzige Signal verdeckt, das zählt: ob jemand kaufbereit ist.

Erstellung und Versand. Sobald die Ziele genehmigt sind, verwaltet der Agent die gesamte Ausführung innerhalb einer einzigen Google Sheet, die sowohl als Datenbank als auch als Benutzeroberfläche dient. Jeder Prospect hat eine Zeile: Firmenname, Kontakt, ICP-Wert, maßgeschneiderter E-Mail-Text, Sendestatus, Follow-up-Entwurf und Pipeline-Stufe. Die Tabelle ist die Quelle der Wahrheit — kein CRM, keine separate Plattform. Wir fügen Werkzeuge nur hinzu, wenn die einfache Version an ihre Grenzen stößt.

Jede E-Mail wird von Grund auf für jeden Prospect verfasst. Unterschiedliche Betreffzeilen, unterschiedliche Ansätze, unterschiedliche Textkörper basierend auf der tatsächlichen Website, dem Team und der Positionierung des Unternehmens. Keine Vorlagen, keine Variablensubstitution. Das Ziel war Relevanz, nicht Volumen.

Der erste Versandversuch nutzte die Instantly-API — ein schlechter Fit für maßgeschneiderte Ansprache. Wir wechselten zu direktem SMTP, wobei die Tabelle den Sendestatus verfolgte. Die erste E-Mail-Charge wurde ohne ordentliche Begrüßung versendet (sprang direkt zum Angebot). Wir korrigierten die Follow-up-Sequenz: ordentliche Anrede, wärmerer Ton, menschlichere Ansprache.

Wir wählten das Werkzeug, das zum Workflow passt — selbst wenn dieses Werkzeug eine Tabelle und SMTP war.

Vierstufige Pipeline: Recherche → Bewertung → Erstellung → Versand und Nachverfolgung — mit einem menschlichen Prüfpunkt nach der Recherche
Ein menschlicher Prüfpunkt nach der Zielgruppenbestimmung und Bewertung. Alles zwischen Genehmigung und Versand läuft ohne Unterbrechung.

Die Ergebnisse

Nach der Inbetriebnahme — der initiale Aufbau dauerte etwa zwei Wochen — änderte sich Folgendes:

  • Der Mensch wechselte vom Machen zum Prüfen. Recherche, Lead-Import, E-Mail-Erstellung und Follow-up-Erstellung — alles vom Agent erledigt. Die Aufgabe des Teams wurde zur Prüfung der Zielliste, Bestätigung der Vorgehensweise und Sichtung der Antworten. Das ist die Zeitersparnis: Was früher Stunden manueller Arbeit waren, wurde zu Minuten der Überprüfung.
  • 1.000 Prospects erreicht ohne Vollzeit-Vertriebsmitarbeiter. Die Pipeline lief im Hintergrund parallel zur Kundenarbeit. Das Volumen war nicht länger durch die Verfügbarkeit des Gründers begrenzt.
  • 4 % positive Rücklaufquote bei maßgeschneiderter Ansprache. Antworten kamen von Prospects, die das Team manuell nicht erreicht hätte. Ein Teil führte zu Gesprächen, die das Team als verfolgenswert einstufte.
  • Follow-ups fielen nicht mehr durchs Raster. Jeder Prospect hatte einen Sendestatus und einen Follow-up-Auslöser in der Tabelle — vom Agent gesetzt, vom Menschen geprüft. Nichts wurde vergessen, weil es von der Erinnerung einer Person abhing.

Was dieser Aufbau erforderte

Der initiale Aufbau dauerte etwa zwei Wochen. Die Pipeline läuft und wird seitdem kontinuierlich verbessert.

Die Recherche-Ebene kam zuerst: die Definition der Bewertungskriterien, das Testen an echten Prospect-Listen und das Herausfinden, welche Signale tatsächliche Antworten und welche nur theoretische Passung vorhersagten. Wir reduzierten von drei ICPs auf zwei, als das Marktsignal klar eine Segment bevorzugte.

Die Betriebsebene kam als Nächstes. Die Tabellenstruktur durchlief mehrere Iterationen, bevor das Feld-Layout sowohl Agent-Schreibvorgänge als auch menschliche Lesevorgänge unterstützte. Die Instantly-Integration war ein Fehlstart — wir verloren einen halben Tag mit dem Debuggen ihrer API, bevor wir zu direktem SMTP wechselten.

Die erste E-Mail-Charge lehrte uns die Lektion mit der Begrüßung: Der Agent schrieb gut recherchierte Inhalte, übersprang aber die sozialen Signale, die eine E-Mail menschlich wirken lassen. Die Lösung war ein Prüfschritt in der Pipeline, keine Prompt-Änderung.