Die Installation von Hermes dauert unter einem Tag. Der Schritt, der die Leistung in den nächsten sechs Monaten bestimmt, ist nicht das Deployment — es ist die Kontextdefinition: dem Agenten beibringen, wie Ihre Aufgaben tatsächlich aussehen, wer Ausnahmen behandelt und was eine korrekte Ausgabe bedeutet. Stimmt das, beginnt Hermes ab der ersten Aufgabe zu verbessern. Stimmt es nicht, kodiert der erste Monat falsche Muster.
Deployment
Klonen Sie das Hermes-Repository, setzen Sie die Umgebungsvariablen und starten Sie den Docker-Container auf Ihrem Server.
Plattformen verbinden
Fügen Sie API-Token oder OAuth-Zugangsdaten für Slack, Gmail, Telegram oder andere Plattformen Ihres Teams hinzu.
Kontext definieren
Schreiben Sie Beispielaufgaben, erwartete Ausgabeformate und Eskalationspfade für jeden Workflow, den Hermes übernehmen soll.
Mit echten Aufgaben testen
Führen Sie 20–50 Live-Aufgaben im reinen Überprüfungsmodus aus und bestätigen Sie, dass die Ausgaben der Kontextdefinition entsprechen, bevor Sie Aktionen aktivieren.
Live gehen
Aktivieren Sie die Aktionsberechtigungen und legen Sie einen wöchentlichen Überprüfungsrhythmus für den ersten Monat fest, um die Skill-Qualität zu verfolgen.
Wie stellen Sie die Hermes-Instanz bereit?
Hermes läuft über Docker und kann auf jedem Standard-VPS bereitgestellt werden. Eine Instanz mit 2 vCPUs und 4 GB RAM reicht für Teams aus, die bis zu einige Hundert Aufgaben täglich verarbeiten. Drei Dinge sind vor dem Start des Containers erforderlich: Docker und Docker Compose auf dem Server installiert, API-Zugang zum Sprachmodell, das Hermes verwenden wird (kompatibel mit OpenAI- und Anthropic-Modell-APIs), und das Hermes-Repository von Nous Research geklont.[¹]
Die Kernkonfiguration liegt in einer .env-Datei: Modell-API-Schlüssel, Server-Port und das agentskills.io-Verbindungstoken für die Skill-Speicherung. Das Ausführen von docker compose up startet die Instanz. Beim ersten Start wird die Modellverbindung initialisiert und das Deployment bei agentskills.io registriert.
Hermes wird unter der MIT-Lizenz veröffentlicht und läuft vollständig auf der eigenen Infrastruktur. Nous Research beschreibt das Deployment-Modell als "einen intelligenten persönlichen Assistenten, der mit zunehmender Betriebszeit leistungsfähiger wird" — er arbeitet auf Ihren Servern, ohne dass Daten an einen Drittanbieter gesendet werden.[¹]
Die häufigsten Probleme in dieser Phase: ungültiges API-Schlüsselformat, Port-Konflikte mit bestehenden Diensten und Firewall-Regeln, die die Webhooks blockieren, die Hermes benötigt, um eingehende Plattformnachrichten zu empfangen. Die meisten lassen sich innerhalb der ersten Stunde des Setups beheben.
Wie verbinden Sie Ihre Plattformen?
Ein einziges Hermes-Deployment verarbeitet alle verbundenen Plattformen gleichzeitig — keine separate Agenteninstanz pro Kanal. Jede Plattform erfordert ein Token oder OAuth-Zugangsdaten. Die Hermes-Admin-Oberfläche führt Schritt für Schritt durch jeden Verbindungsprozess:
- Slack: Erstellen Sie eine Slack-App, fügen Sie Bot-Berechtigungen hinzu (channels:read, chat:write, messages:read), installieren Sie sie im Workspace und fügen Sie das Bot User OAuth Token zur Hermes-Konfiguration hinzu
- Gmail: Erstellen Sie ein Google Cloud-Projekt, aktivieren Sie die Gmail API, generieren Sie OAuth2-Zugangsdaten und schließen Sie den Zustimmungsflow ab
- Telegram: Erstellen Sie einen Bot über @BotFather und fügen Sie das Bot-Token hinzu
- Microsoft Teams, Discord, WhatsApp: Folgen Sie den entsprechenden OAuth- oder Token-Flows, die im Hermes-Plattformhandbuch dokumentiert sind
Jede neue Plattform benötigt 15–30 Minuten zur Verbindung. Nach der Verbindung bestätigt die Hermes-Admin-Oberfläche den Status und zeigt eingehende Nachrichtenaktivität für jeden Kanal an.
Die meisten Hermes-Setups scheitern nicht am Deployment — sondern an der Kontextdefinition.
Was umfasst die Kontextdefinition?
Die Kontextdefinition ist der Bereich, in dem die meisten Hermes-Setups unterdurchschnittlich abschneiden. Hermes beginnt ab der ersten abgeschlossenen Aufgabe, Skill-Objekte zu erstellen — strukturierte Datensätze darüber, wie jede Aufgabenkategorie zu behandeln ist. Die in den ersten Monaten aufgebauten Skills spiegeln die empfangenen Eingaben und die produzierten Ausgaben wider. Eine schlechte Kontextdefinition in Woche eins überträgt sich auf jeden Skill, der aus diesen Aufgaben erstellt wird.
Hermes beginnt ab der ersten abgeschlossenen Aufgabe, Skills zu kodieren. Wenn die ersten 50 Aufgaben schlecht formuliert sind oder ständig korrigiert werden, werden diese Korrekturen zum kodierten Ansatz. Die Qualität der Skills in Monat drei spiegelt die Qualität der Kontextdefinition in Woche eins wider.
Die Kontextdefinition erfordert vier Eingaben für jeden Workflow, den Hermes übernehmen soll:
- Beispieleingaben — 5–10 echte Beispiele von Aufgaben, die der Workflow empfangen wird (tatsächliche E-Mails, Nachrichten oder Anfragen, keine erfundenen)
- Erwartetes Ausgabeformat — wie eine korrekte Ausgabe aussieht, mit kommentierten Beispielen, die zeigen, was jede Ausgabe richtig macht
- Ausnahmen-Zuständiger — Name und Kontaktdaten der Person, an die Hermes eskaliert, wenn unsicher
- Aufgabenkategoriebezeichnung — wie Hermes diesen Aufgabentyp in seiner Skill-Bibliothek benennen und gruppieren soll
Dieser Schritt dauert in der Regel 1–3 Arbeitstage pro Workflow — nicht weil er technisch komplex ist, sondern weil das Festlegen von "korrekt" den Input der Mitarbeiter erfordert, die die Aufgaben heute erledigen.
Wie testen Sie Hermes vor dem Live-Gang?
Bevor Sie Aktionsberechtigungen aktivieren, führen Sie eine Testphase von 20–50 echten Aufgaben im reinen Überprüfungsmodus durch. Hermes verarbeitet eingehende Aufgaben und produziert Ausgaben, ergreift aber keine Aktion in verbundenen Systemen — keine E-Mails werden versendet, keine Datensätze erstellt — bis eine Person jede Ausgabe genehmigt.
Überprüfen Sie jede Ausgabe anhand der Kontextdefinition. Eine korrekte Ausgabe entspricht dem erwarteten Format und verwendet die Informationen aus der Eingabe präzise. Markieren Sie Ausgaben, die nicht stimmen, und fügen Sie die korrekte Version als Beispielpaar zur Kontextdefinition hinzu. Nach 20 aufeinanderfolgenden korrekten Ausgaben für einen Workflow ist dieser Workflow bereit für den Live-Betrieb.
Beim Live-Gang aktivieren Sie die Aktionsberechtigungen pro Plattform. Legen Sie für den ersten Monat einen wöchentlichen Überprüfungsrhythmus fest: Überprüfen Sie eine Auswahl aktueller Ausgaben, notieren Sie wiederkehrende Fehlermuster und aktualisieren Sie Kontextdefinitionen wo nötig. Die Skill-Akkumulation beschleunigt sich in den Wochen 2–4, wenn Hermes mehr Aufgabenvarianten verarbeitet — am Ende von Monat eins werden gängige Aufgabentypen in der Regel korrekt verarbeitet. Für eine vollständige Erklärung, wie Skills aufgebaut werden und sich im Laufe der Zeit kompoundieren, lesen Sie wie Hermes lernt.
Häufig gestellte Fragen
Auf welchem Server läuft Hermes? Hermes läuft über Docker auf jedem Standard-VPS. Eine Instanz mit 2 vCPUs und 4 GB RAM verarbeitet Hunderte von täglichen Aufgaben für ein kleines Team. Nous Research empfiehlt mindestens 2 GB RAM; 4 GB bietet Spielraum für gleichzeitige Plattformverbindungen und Skill-Verarbeitung.
Wie lange dauert das Hermes-Setup? Deployment und Plattformverbindungen dauern weniger als einen Tag. Die Kontextdefinition — der Schritt, der die Skill-Qualität bestimmt — dauert 1–3 Tage pro Workflow, je nachdem wie viele Workflows konfiguriert werden und wie schnell das Team echte Aufgabenbeispiele und Ausgabestandards bereitstellen kann.
Welche Plattformen unterstützt Hermes? Hermes verbindet sich von einem einzigen Deployment aus mit 20+ Plattformen, darunter Slack, Gmail, Telegram, Discord, WhatsApp, Microsoft Teams und Signal. Jede Plattform erfordert ein separates Token oder OAuth-Zugangsdaten. Die Hermes-Admin-Oberfläche dokumentiert die Verbindungsschritte für jede Plattform.
Was passiert, wenn Hermes bei einer Aufgabe unsicher ist? Hermes eskaliert an den in der Kontextdefinition für diesen Workflow festgelegten Ausnahmen-Zuständigen. Dieser erhält die Aufgabe und Hermes' besten Ausgabeversuch, prüft ihn und genehmigt oder korrigiert ihn. Korrekturen werden als Feedback in den Skill für diese Aufgabenkategorie eingespeist.
Quellenangaben
- Nous Research, Hermes documentation. https://hermes-agent.nousresearch.com/docs/