Wie Hermes lernt

Wenn Hermes eine Aufgabe abschließt, geht der Agent nicht einfach weiter. Hermes erstellt ein Skill-Objekt — strukturierten Code, Testfälle und Beispielpaare — und speichert es für jede ähnliche Aufgabe, die folgt. Skills kompoundieren über die Zeit. Der Agent in Monat drei verarbeitet Sonderfälle, die Monat eins verfehlte — nicht weil das Modell neu trainiert wurde, sondern weil die Skill-Bibliothek gewachsen ist.

Was erstellt Hermes, wenn es eine Aufgabe abschließt?

Hermes erstellt aus jeder abgeschlossenen Aufgabe ein Skill-Objekt. Ein Skill-Objekt ist ein strukturiertes Dokument mit vier Elementen:

Aufgabenkategorie — wie Hermes diesen Aufgabentyp klassifiziert (z. B. "candidate-application", "invoice-chase", "client-status-update")
Code-Ansatz — die Methode, die Hermes zur Erledigung der Aufgabe verwendet hat, als ausführbarer Code gespeichert
Testfälle — Eingabe-/Ausgabepaare, die aus der Aufgabe abgeleitet werden und zur Validierung zukünftiger Skill-Anwendungen dienen
Beispielpaare — eine Reihe spezifischer Eingaben und der jeweils korrekten Ausgaben

Die Skill-Erstellung erfolgt automatisch — nach der Kontextdefinition ist keine weitere Konfiguration erforderlich. Der Auslöser ist der Aufgabenabschluss, kein geplanter Trainingslauf. Ein Skill, der aus einer am Montag verarbeiteten Bewerbung erstellt wurde, steht sofort für die nächste Bewerbung bereit, die am Dienstag eingeht.

Nous Research beschreibt Hermes als "einen intelligenten persönlichen Assistenten, der mit zunehmender Betriebszeit leistungsfähiger wird" — das ist der Mechanismus hinter dieser Aussage: Jede erledigte Aufgabe erweitert eine wachsende Bibliothek strukturierter Ansätze.[¹]

Anatomiekarte eines Skill-Objekts mit vier Feldern: Aufgabenkategorie (candidate-application), Code-Ansatz (ausführbare Methode), Testfälle (Eingabe-/Ausgabe-Validierungspaare), Beispielpaare (spezifische Eingaben und korrekte Ausgaben) — Ein Skill-Objekt speichert, wie Hermes eine Aufgabe gelöst hat — nicht nur, dass es sie gelöst hat.

Wie verbessern sich Skills mit der Zeit?

Skills kompoundieren. Monat drei verarbeitet Sonderfälle, die Monat eins verfehlte.

Skills verbessern sich durch Akkumulation. Jedes Mal, wenn Hermes eine Aufgabe erkennt, die einer vorhandenen Skill-Kategorie entspricht, wendet Hermes den Skill an, prüft, ob die Ausgabe dem erwarteten Format entspricht, und fügt das neue Eingabe-Ausgabe-Paar dem Beispielset des Skills hinzu. Ein Skill, der 50 Bewerbungen verarbeitet hat, ist bei Formatvarianten präziser als einer, der nur 5 verarbeitet hat.

Der Lernmechanismus von Hermes arbeitet auf der Inferenzebene — nicht durch Neutraining des zugrundeliegenden Modells. Skills sind Skill-Objekte: Code, Tests und Beispiele für jede Aufgabenkategorie. Das Modell selbst verändert sich nicht. Was sich verändert, ist die Bibliothek von Ansätzen, die Hermes für Ihre spezifischen Workflows hat.

Der praktische Effekt ist eine Leistungskurve. In den ersten zwei Wochen verarbeitet Hermes die häufigsten Aufgabenvarianten korrekt. In Monat zwei und drei verarbeitet dieselbe Instanz Sonderfälle, die zuvor eine Eskalation erforderten — weil jede abgeschlossene Aufgabe Beispiele zum relevanten Skill hinzugefügt hat. Eine Hermes-Instanz, die drei Monate lang den Bewerbungstriage-Workflow einer Recruiting-Agentur verarbeitet hat, versteht Variationen im E-Mail-Format, unvollständige Lebensläufe und weitergeleitete Bewerbungen auf eine Weise, die die Instanz aus Monat eins nicht konnte — weil jede dieser Situationen zum Skill "candidate-application" beigetragen hat.

Leistungskurve, die zeigt, wie die Genauigkeit von Hermes-Aufgaben über drei Monate zunimmt: beginnend mit gängigen Varianten in Monat eins, expandierend zu Sonderfällen in Monat zwei und drei, während Skills akkumulieren — Die Skill-Akkumulation ist im ersten Monat am schnellsten. Die Verarbeitung von Sonderfällen verbessert sich im zweiten und dritten Monat.

Wo werden Skills gespeichert und können sie geteilt werden?

Skills werden bei agentskills.io gespeichert, einem offenen Standard für den Austausch von Agenten-Skills.[²] Das agentskills.io-Register speichert Skill-Objekte als strukturierte Dateien — Code, Tests und Beispiele — die mit anderen Agentensystemen kompatibel sind, darunter Cursor, GitHub Copilot und Claude Code.

Ein Skill, der von einer Hermes-Instanz erstellt wurde, kann zu agentskills.io exportiert und von einer anderen importiert werden. Ein Unternehmen mit zwei regionalen Hermes-Instanzen teilt Skills zwischen ihnen — ein "candidate-application"-Skill, der aus den E-Mail-Mustern des britischen Büros erstellt wurde, steht dem deutschen Büro zur Verfügung. Skills müssen für dieselbe Aufgabenkategorie nicht zweimal aufgebaut werden.

Der offene Standard bedeutet auch, dass Skills nicht an Hermes gebunden sind. Ein Skill, der aus einem Recruiting-Workflow erstellt wurde, kann anderen Teams zur Verfügung gestellt werden, die andere Agentensysteme verwenden, die das agentskills.io-Format unterstützen. Eine vollständige Anleitung zur Bereitstellung von Hermes und zur Einrichtung der Kontextdefinition — dem Schritt, der die Skill-Qualität bestimmt — finden Sie in der Hermes Setup-Anleitung.

Skill-Sharing-Diagramm: Hermes-Instanz A erstellt einen Skill und überträgt ihn an agentskills.io, von wo er von Hermes-Instanz B sowie Cursor und Claude Code abgerufen werden kann — Von einer Hermes-Instanz aufgebaute Skills stehen jedem System zur Verfügung, das den agentskills.io-Standard unterstützt.

Was bedeutet das für ein Unternehmen, das Hermes betreibt?

Der Skill-Kompoundierungseffekt hat zwei praktische Konsequenzen.

Erstens: Hermes wird besser in Ihren spezifischen Workflows — nicht bei allgemeinen Aufgaben. Skills kodieren, wie Ihre Aufgaben tatsächlich aussehen — Ihre Kunden, Ihre Ausgabeformate, Ihre Eskalationsmuster. Eine Hermes-Instanz, die drei Monate lang Ihre Recruiting-Workflows verarbeitet hat, versteht Ihre spezifischen Kandidatentypen und Antwortkonventionen auf eine Weise, die eine frisch bereitgestellte Instanz nicht tut. Die Verbesserung ist spezifisch für Ihren Kontext, kein generisches Upgrade.

Zweitens: Die Fehlerquote nimmt über die Zeit ab. Eine Aufgabenkategorie, die in Monat eins 30 % der Zeit eine Korrektur erforderte, wird bis Monat drei weniger Korrekturen erfordern — vorausgesetzt, der Kontext wurde von Anfang an korrekt definiert. Schlecht definierter Kontext produziert Skills, die falsche Ansätze kodieren. Die Kontextdefinition in Woche eins richtig hinzubekommen ist der wichtigste Hebel für die Skill-Qualität in Monat drei. Für ein grundlegendes Verständnis, wie KI-Agenten funktionieren, lesen Sie Was ist ein KI-Agent. Für die vollständigen Fähigkeiten von Hermes lesen Sie Was ist Hermes.

Häufig gestellte Fragen

Wie lernt Hermes aus abgeschlossenen Aufgaben? Hermes erstellt ein Skill-Objekt, wenn eine Aufgabe abgeschlossen wird. Das Skill-Objekt enthält die Aufgabenkategorie, den verwendeten Code-Ansatz, aus der Aufgabe abgeleitete Testfälle und Beispiel-Eingabe-Ausgabe-Paare. Bei der nächsten ähnlichen Aufgabe wendet Hermes den Skill an und fügt das neue Beispiel hinzu. Skills verbessern sich, wenn mehr Beispiele akkumulieren.

Trainiert Hermes das zugrundeliegende Modell neu? Nein. Der Lernmechanismus von Hermes arbeitet auf der Inferenzebene. Das zugrundeliegende Sprachmodell verändert sich nicht. Skills werden als strukturierte Skill-Objekte bei agentskills.io gespeichert — Code, Tests und Beispiele — die Hermes bei der Verarbeitung ähnlicher Aufgaben anwendet. Das Modell bleibt unverändert; die Skill-Bibliothek wächst.

Können Skills, die von einer Hermes-Instanz erstellt wurden, von einer anderen verwendet werden? Ja. Skills werden bei agentskills.io gespeichert, einem offenen Standard für den Austausch von Agenten-Skills. Ein Skill, der von einer Hermes-Instanz erstellt wurde, kann exportiert und von einer anderen importiert werden. Skills sind auch mit anderen Agentensystemen kompatibel, die das agentskills.io-Format unterstützen, darunter Cursor und Claude Code.

Wie lange dauert es, bis sich Hermes merklich verbessert? Die häufigsten Aufgabenvarianten werden in der Regel innerhalb der ersten zwei bis vier Wochen korrekt verarbeitet, wenn Skills aus echten Aufgabenabschlüssen akkumulieren. Die Verarbeitung von Sonderfällen verbessert sich in Monat zwei und drei. Die Verbesserungsrate hängt vom Aufgabenvolumen ab — mehr abgeschlossene Aufgaben produzieren schneller mehr Skill-Beispiele.

Quellenangaben

Nous Research, Hermes documentation. https://hermes-agent.nousresearch.com/docs/
agentskills.io, open standard for agent skills. https://agentskills.io