Wenn Hermes eine Aufgabe abschließt, geht der Agent nicht einfach weiter. Hermes erstellt ein Skill-Objekt — strukturierten Code, Testfälle und Beispielpaare — und speichert es für jede ähnliche Aufgabe, die folgt. Skills kompoundieren über die Zeit. Der Agent in Monat drei verarbeitet Sonderfälle, die Monat eins verfehlte — nicht weil das Modell neu trainiert wurde, sondern weil die Skill-Bibliothek gewachsen ist.
Was erstellt Hermes, wenn es eine Aufgabe abschließt?
Hermes erstellt aus jeder abgeschlossenen Aufgabe ein Skill-Objekt. Ein Skill-Objekt ist ein strukturiertes Dokument mit vier Elementen:
- Aufgabenkategorie: wie Hermes diesen Aufgabentyp klassifiziert (z. B. "candidate-application", "invoice-chase", "client-status-update")
- Code-Ansatz: die Methode, die Hermes zur Erledigung der Aufgabe verwendet hat, als ausführbarer Code gespeichert
- Testfälle: Eingabe-/Ausgabepaare, die aus der Aufgabe abgeleitet werden und zur Validierung zukünftiger Skill-Anwendungen dienen
- Beispielpaare: eine Reihe spezifischer Eingaben und der jeweils korrekten Ausgaben
Die Skill-Erstellung erfolgt automatisch — nach der Kontextdefinition ist keine weitere Konfiguration erforderlich. Der Auslöser ist der Aufgabenabschluss, kein geplanter Trainingslauf. Ein Skill, der aus einer am Montag verarbeiteten Bewerbung erstellt wurde, steht sofort für die nächste Bewerbung bereit, die am Dienstag eingeht.
Die Skill-Objekt-Struktur bedeutet, dass Hermes eine Aufgabe nicht jedes Mal von Grund auf verarbeiten muss. Wenn eine neue Bewerbung eintrifft, prüft Hermes, ob ein vorhandener Skill der Aufgabenkategorie entspricht. Wenn ja, wendet Hermes den Code-Ansatz an und kalibriert die Ausgabe anhand der Beispielpaare. Das Ergebnis ist eine Ausgabe, die alles widerspiegelt, was Hermes aus jeder ähnlichen Aufgabe gelernt hat — nicht nur der jüngsten.
Das ist der Mechanismus hinter dem Anspruch, dass Hermes "mit zunehmender Betriebszeit leistungsfähiger wird." Jede erledigte Aufgabe ist eine Stimme dafür, wie der richtige Ansatz aussieht. Jede Korrektur ist eine Stimme dagegen. Im Laufe der Zeit spiegelt der Skill für einen gut geführten Workflow Hunderte von Beispielen korrekter Ausgaben und Dutzende von Beispielen zu vermeidender Ausgaben wider.
Nous Research beschreibt Hermes als "einen intelligenten persönlichen Assistenten, der mit zunehmender Betriebszeit leistungsfähiger wird" — das ist der Mechanismus hinter dieser Aussage: Jede erledigte Aufgabe erweitert eine wachsende Bibliothek strukturierter Ansätze.[¹]
Wie verbessern sich Skills mit der Zeit?
Skills kompoundieren. Monat drei verarbeitet Sonderfälle, die Monat eins verfehlte.
Skills verbessern sich durch Akkumulation. Jedes Mal, wenn Hermes eine Aufgabe erkennt, die einer vorhandenen Skill-Kategorie entspricht, wendet Hermes den Skill an, prüft, ob die Ausgabe dem erwarteten Format entspricht, und fügt das neue Eingabe-Ausgabe-Paar dem Beispielset des Skills hinzu. Ein Skill, der 50 Bewerbungen verarbeitet hat, ist bei Formatvarianten präziser als einer, der nur 5 verarbeitet hat.
Der Lernmechanismus von Hermes arbeitet auf der Inferenzebene — nicht durch Neutraining des zugrundeliegenden Modells. Skills sind Skill-Objekte: Code, Tests und Beispiele für jede Aufgabenkategorie. Das Modell selbst verändert sich nicht. Was sich verändert, ist die Bibliothek von Ansätzen, die Hermes für Ihre spezifischen Workflows hat.
Der praktische Effekt ist eine Leistungskurve. In den ersten zwei Wochen verarbeitet Hermes die häufigsten Aufgabenvarianten korrekt. In Monat zwei und drei verarbeitet dieselbe Instanz Sonderfälle, die zuvor eine Eskalation erforderten — weil jede abgeschlossene Aufgabe Beispiele zum relevanten Skill hinzugefügt hat. Eine Hermes-Instanz, die drei Monate lang den Bewerbungstriage-Workflow einer Recruiting-Agentur verarbeitet hat, versteht Variationen im E-Mail-Format, unvollständige Lebensläufe und weitergeleitete Bewerbungen auf eine Weise, die die Instanz aus Monat eins nicht konnte — weil jede dieser Situationen zum Skill "candidate-application" beigetragen hat.
| Zeitrahmen | Skill-Zustand | Ohne Eskalation verarbeitet | Noch eskaliert |
|---|---|---|---|
| Tage 1–7 | Skills aus Kontextdefinition initialisiert | Die häufigsten Aufgabenvarianten in definierten Kategorien | Eingaben, die deutlich von Kontext-Beispielen abweichen |
| Wochen 2–4 | Skills akkumulieren aus Live-Abschlüssen | Gängige Varianten plus erstmalig gesehene Abweichungen | Ungewöhnliche Eingabeformate, unvollständige Informationen |
| Monat 2–3 | Skills reifen in hochvolumigen Kategorien | Die meisten Sonderfälle aus dem echten Betrieb | Tatsächlich neuartige Situationen ohne bisherige Beispiele |
| Monat 4+ | Stabiler Zustand für etablierte Workflows | Alle etablierten Muster zuverlässig | Nur völlig neue Workflow-Typen |
Die Progressionsrate hängt vom Aufgabenvolumen ab. Ein Workflow mit 50 Aufgaben pro Woche erreicht Monat-zwei-Leistung schneller als einer mit 5 pro Woche.
Wo werden Skills gespeichert und können sie geteilt werden?
Skills werden bei agentskills.io gespeichert, einem offenen Standard für den Austausch von Agenten-Skills.[²] Das agentskills.io-Register speichert Skill-Objekte als strukturierte Dateien — Code, Tests und Beispiele — die mit anderen Agentensystemen kompatibel sind, darunter Cursor, GitHub Copilot und Claude Code.
Ein Skill, der von einer Hermes-Instanz erstellt wurde, kann zu agentskills.io exportiert und von einer anderen importiert werden. Ein Unternehmen mit zwei regionalen Hermes-Instanzen teilt Skills zwischen ihnen — ein "candidate-application"-Skill, der aus den E-Mail-Mustern des britischen Büros erstellt wurde, steht dem deutschen Büro zur Verfügung. Skills müssen für dieselbe Aufgabenkategorie nicht zweimal aufgebaut werden.
Der offene Standard bedeutet auch, dass Skills nicht an Hermes gebunden sind. Ein Skill, der aus einem Recruiting-Workflow erstellt wurde, kann anderen Teams zur Verfügung gestellt werden, die andere Agentensysteme verwenden, die das agentskills.io-Format unterstützen. Eine vollständige Anleitung zur Bereitstellung von Hermes und zur Einrichtung der Kontextdefinition — dem Schritt, der die Skill-Qualität bestimmt — finden Sie in der Hermes Setup-Anleitung.
Für Unternehmen mit mehreren Hermes-Instanzen hat der Skill-Sharing-Mechanismus eine direkte operative Bedeutung. Eine Instanz, die 300 Bewerbungen verarbeitet hat, hat einen Skill aufgebaut, der 300 Beispiele korrekter Ausgaben widerspiegelt. Dieser Skill ist exportierbar. Eine Instanz, die mit einem importierten Skill startet, erbt die Abdeckung von 300 vorherigen Beispielen statt nur von der Kontextdefinition auszugehen — und erreicht typischerweise schneller den stabilen Zustand.
Was bedeutet das für ein Unternehmen, das Hermes betreibt?
Der Skill-Kompoundierungseffekt hat zwei praktische Konsequenzen.
Erstens: Hermes wird besser in Ihren spezifischen Workflows — nicht bei allgemeinen Aufgaben. Skills kodieren, wie Ihre Aufgaben tatsächlich aussehen — Ihre Kunden, Ihre Ausgabeformate, Ihre Eskalationsmuster. Eine Hermes-Instanz, die drei Monate lang Ihre Recruiting-Workflows verarbeitet hat, versteht Ihre spezifischen Kandidatentypen und Antwortkonventionen auf eine Weise, die eine frisch bereitgestellte Instanz nicht tut. Die Verbesserung ist spezifisch für Ihren Kontext, kein generisches Upgrade.
Diese Spezifität ist keine Einschränkung — sie ist das Design. Eine allgemeine Skill-Bibliothek aus Tausenden verschiedener Unternehmen würde Konventionen enthalten, die nicht zu Ihrem Unternehmen passen. Eine Skill-Bibliothek aus Ihren eigenen Aufgaben spiegelt den spezifischen Ton, das Format und das Ausnahme-Handling wider, das Ihre Kunden und Ihr Team erwarten.
Zweitens: Die Fehlerquote nimmt über die Zeit ab. Eine Aufgabenkategorie, die in Monat eins 30 % der Zeit eine Korrektur erforderte, wird bis Monat drei weniger Korrekturen erfordern — vorausgesetzt, der Kontext wurde von Anfang an korrekt definiert. Schlecht definierter Kontext produziert Skills, die falsche Ansätze kodieren. Die Kontextdefinition in Woche eins richtig hinzubekommen ist der wichtigste Hebel für die Skill-Qualität in Monat drei. Für ein grundlegendes Verständnis, wie KI-Agenten funktionieren, lesen Sie Was ist ein KI-Agent. Für die vollständigen Fähigkeiten von Hermes lesen Sie Was ist Hermes.
Skill-Drift und Wartung
Skills werden gespeichert, sind aber nicht statisch — und auch nicht selbstwartend. Ein Skill, der aus einem Kontext erstellt wurde, der den Workflow nicht mehr widerspiegelt, produziert im Laufe der Zeit zunehmend falsche Ausgaben. Der Skill selbst hat sich nicht verschlechtert; der Kontext, aus dem er aufgebaut wurde, ist von der aktuellen Erwartung abgedriftet.
Das Signal ist eine steigende Korrekturquote bei einer Aufgabenkategorie, die zuvor stabil war. Wenn eine Kategorie, die in Monat zwei 5 % Korrekturquote hatte, in Monat sechs 20 % erfordert, hat der Kontext gedriftet, nicht das Modell.
Die Lösung ist das Aktualisieren der Kontextdefinition für diese Aufgabenkategorie: neue Beispiele hinzufügen, veraltete entfernen, die Ausgabeformat-Kommentierung aktualisieren.
| Drift-Signal | Wahrscheinliche Ursache | Lösung |
|---|---|---|
| Steigende Korrekturquote bei stabiler Kategorie | Ausgabe-Standards haben sich geändert; Kontext nicht aktualisiert | Beispielpaare und Ausgabeformat-Kommentierung aktualisieren |
| Korrekte Ausgaben bei Hauptpfad, Fehler bei Sonderfällen | Sonderfälle nicht in Kontext-Beispielen | 3–5 Beispiele für Sonderfälle und ihre korrekten Ausgaben hinzufügen |
| Konsistenter Fehler bei einem bestimmten Feld | Feldformat im verbundenen System geändert | Feldreferenz in Kontextdefinition aktualisieren |
| Hohe Eskalationsrate trotz steigendem Volumen | Kontext spiegelt noch frühe Beispiele wider | Aktuelle Aufgabenbeispiele hinzufügen, um Skill-Abdeckung zu erweitern |
Häufig gestellte Fragen
Wie lernt Hermes aus abgeschlossenen Aufgaben? Hermes erstellt ein Skill-Objekt, wenn eine Aufgabe abgeschlossen wird. Das Skill-Objekt enthält die Aufgabenkategorie, den verwendeten Code-Ansatz, aus der Aufgabe abgeleitete Testfälle und Beispiel-Eingabe-Ausgabe-Paare. Bei der nächsten ähnlichen Aufgabe wendet Hermes den Skill an und fügt das neue Beispiel hinzu. Skills verbessern sich, wenn mehr Beispiele akkumulieren. Korrekturen von menschlichen Prüfern werden ebenfalls als Beispielpaare einbezogen — der Korrekturprozess ist Teil des Lernprozesses.
Trainiert Hermes das zugrundeliegende Modell neu? Nein. Der Lernmechanismus von Hermes arbeitet auf der Inferenzebene. Das zugrundeliegende Sprachmodell verändert sich nicht. Skills werden als strukturierte Skill-Objekte bei agentskills.io gespeichert — Code, Tests und Beispiele — die Hermes bei der Verarbeitung ähnlicher Aufgaben anwendet. Das Modell bleibt unverändert; die Skill-Bibliothek wächst.
Können Skills, die von einer Hermes-Instanz erstellt wurden, von einer anderen verwendet werden? Ja. Skills werden bei agentskills.io gespeichert, einem offenen Standard für den Austausch von Agenten-Skills. Ein Skill, der von einer Hermes-Instanz erstellt wurde, kann exportiert und von einer anderen importiert werden. Skills sind auch mit anderen Agentensystemen kompatibel, die das agentskills.io-Format unterstützen, darunter Cursor und Claude Code.
Wie lange dauert es, bis sich Hermes merklich verbessert? Die häufigsten Aufgabenvarianten werden in der Regel innerhalb der ersten zwei bis vier Wochen korrekt verarbeitet, wenn Skills aus echten Aufgabenabschlüssen akkumulieren. Die Verarbeitung von Sonderfällen verbessert sich in Monat zwei und drei. Die Verbesserungsrate hängt vom Aufgabenvolumen ab — mehr abgeschlossene Aufgaben produzieren schneller mehr Skill-Beispiele — und von der Korrekturqualität, da korrigierte Ausgaben die informativsten Beispiele für die Skill-Bibliothek liefern.
Degradiert die Skill-Qualität, wenn Hermes für einen Zeitraum nicht genutzt wird? Skill-Objekte werden persistent bei agentskills.io gespeichert und degradieren nicht durch Inaktivität. Eine Hermes-Instanz, die einen Monat pausiert und neu gestartet wird, nimmt den Betrieb mit derselben Skill-Bibliothek wieder auf. Das einzige Szenario, in dem die Skill-Qualität sinkt, ist wenn sich Workflows oder Ausgabe-Standards des Unternehmens geändert haben und die Kontextdefinition nicht aktualisiert wurde.
Quellenangaben
- Nous Research, Hermes documentation. https://hermes-agent.nousresearch.com/docs/
- agentskills.io, open standard for agent skills. https://agentskills.io
Eine vollständige Anleitung zum Deployment und zur Kontextdefinition finden Sie in der Hermes Setup-Anleitung.