Hermes Agent ist kostenlos. Zumindest die Software selbst.
Genau dieser Satz steht auf jeder zweiten Seite, wenn du nach „Hermes Agent Kosten“ suchst. Stimmt auch. Hermes Agent steht unter MIT-Lizenz, du zahlst keinen Cent für die Installation.
Das Problem?
Die Software ist nur ein Teil der Rechnung. Damit Hermes Agent tatsächlich arbeitet, brauchst du Hardware, ein KI-Modell und je nach Setup ein paar Extras. Und die kosten Geld.
Hermes hat aber einen Vorteil gegenüber anderen Agent-Frameworks. Der Local-First-Ansatz spart dir Server, VPS und Cloud-Infrastruktur, solange du Hermes nur für dich selbst nutzt. Hier zeige ich dir die echten Kosten, die versteckten Posten und wie du dein Budget realistisch planst.
- Hermes Agent selbst ist kostenlos (MIT-Lizenz). Die echten Kosten entstehen durch API-Token (0 bis 80+ EUR/Mo.) und optional Hosting für 24/7-Channels (3 bis 30 EUR/Mo.).
- Ein realistisches Setup für Privatnutzer kostet zwischen 0 und 15 EUR pro Monat. Mit Ollama und lokalen Modellen bleibst du unter 5 EUR (nur Stromkosten).
- Ab ca. 30 EUR API-Verbrauch pro Monat wird ein Claude-Pro- oder ChatGPT-Plus-Abo (jeweils 23 EUR) eine vergleichbare Option, sofern du nur einen Channel brauchst.
Die Kostenstruktur von Hermes Agent im Überblick
Die Kosten setzen sich aus vier Posten zusammen, Pflicht sind davon nur die ersten zwei:
Kostenfaktor | Preisspanne | Pflicht? |
|---|---|---|
| Hermes-Agent-Software | 0 EUR (MIT-Lizenz) | Ja |
| Hardware / Strom | 0 bis 10 EUR/Mo. | Ja |
| API-Token (Cloud-LLM) | 0 bis 80+ EUR/Mo. | Nein (Ollama als Alternative) |
| Tool-Gateway-Tools | 0 bis 20 EUR/Mo. | Nein |
| Server-Hosting (für 24/7-Channels) | 3 bis 30 EUR/Mo. | Nein (nur für persistente Bots) |
| Channel-Kosten (Twilio, Mailserver etc.) | 0 bis 15 EUR/Mo. | Nein |
| Domain (optional) | 0,50 bis 1,50 EUR/Mo. | Nein |
Du kannst Hermes Agent für 0 EUR betreiben, wenn du ihn nur lokal auf deinem Rechner nutzt und ein lokales Modell via Ollama einsetzt. Sobald du Cloud-Modelle wie Claude oder GPT verwenden willst, reden wir über 5 bis 30 EUR pro Monat. Für ein professionelles Multi-Channel-Setup mit Telegram-, Discord- und E-Mail-Bot, das 24/7 läuft, landest du bei 50 bis 150+ EUR.
Hardware-Kosten: Was deine Maschine leisten muss
Hermes Agent selbst ist extrem leichtgewichtig. Ein Python-Prozess, der ein paar hundert MB RAM zieht. Der Hardware-Bedarf hängt nur davon ab, ob du Cloud-LLMs oder lokale Modelle nutzt.
Setup | RAM | CPU | GPU | Geeignet für |
|---|---|---|---|---|
| Minimal (Cloud-only) | 4 GB | Beliebig | Nein | Nur Cloud-LLMs, kein Ollama |
| Laptop-Standard | 16 GB | 4 Cores+ | Integrated | Cloud-LLMs + kleine Ollama-Modelle (7B) |
| Mac Mini M4 / Linux-Desktop | 32 GB | Apple Silicon / Ryzen | Integrated/Mid | Mittlere Ollama-Modelle (14B-32B) |
| Power-Workstation | 64 GB+ | High-End | RTX 4090 / M-Series Max | Große Ollama-Modelle (70B+), schnelle Antworten |
| Android (Termux) | 6 GB+ | Snapdragon 8 Gen 2+ | Nein | Cloud-LLMs unterwegs, Mini-Modelle |
Für die meisten Privatnutzer reicht ein Laptop mit 16 GB RAM. Das MacBook Air M4 für rund 1.200 EUR ist ein solider Allrounder, der sowohl Cloud-LLMs als auch kleinere Ollama-Modelle stemmt.
API-Kosten: Welches LLM passt zu deinem Budget?
Die API-Kosten sind der zweite große Posten und der variabelste. Hermes unterstützt über 30 LLM-Provider, das sind die wichtigsten Optionen für 2026:
Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) | Typische Monatskosten |
|---|---|---|---|
| GPT-5 nano | 0,05 USD | 0,40 USD | 1 bis 3 EUR |
| Claude Haiku 4.5 | 1 USD | 5 USD | 5 bis 15 EUR |
| Gemini 3.1 Pro | 2 USD | 12 USD | 10 bis 25 EUR |
| Claude Sonnet 4.6 | 3 USD | 15 USD | 15 bis 30 EUR |
| GPT-5.5 | 5 USD | 30 USD | 25 bis 60 EUR |
| Claude Opus 4.7 | 5 USD | 25 USD | 30 bis 80+ EUR |
| Ollama (lokal) | 0 EUR | 0 EUR | 0 EUR (nur Strom) |
Für die meisten Hermes-Nutzer ist GPT-5 nano oder Claude Haiku 4.5 der Sweet Spot. Beide reichen für Web-Suchen, Zusammenfassungen, einfache Recherche und die typischen Channel-Antworten.
Wenn du komplexe Aufgaben automatisierst (mehrstufige Workflows, Code-Generierung, agentenhafte Browser-Steuerung), lohnt sich der Sprung zu Claude Sonnet 4.6. Die Qualität steigt deutlich, die Kosten auch. GPT-5.5 ist beim Output noch teurer (30 USD pro 1M Output-Tokens), hat aber aktuell den höchsten SWE-bench-Score am Markt.
hermes auth wechselt Hermes automatisch, wenn ein Provider rate-limited ist.Die kostenlose Alternative: Ollama plus lokale Modelle
Ollama ist der Weg, Hermes komplett ohne API-Kosten zu betreiben. Du lädst ein Open-Source-Modell (z. B. Qwen 2.5 Coder, Llama 3.3 oder DeepSeek R1 Distill) auf deinen Rechner und lässt es lokal laufen.
Lokale Modelle der 7B- bis 32B-Klasse sind 2026 deutlich besser geworden, kommen aber an Claude Sonnet oder GPT-5.5 nicht heran. Für selbstverbessernde Skills, einfache Channel-Antworten und Routine-Automatisierung reichen sie. Für agentenhafte Recherchen oder komplexes Reasoning solltest du ein Cloud-Modell als Backup einrichten.
Mehr Details zur Auswahl findest du in meiner Übersicht zu Open-Source-LLMs.
Drei realistische Kostenszenarien
Szenario 1: Hobby (0 bis 5 EUR/Mo.)
Du willst Hermes Agent ausprobieren und privat nutzen. Lokal auf deinem Rechner, kein 24/7-Server.
Posten | Kosten |
|---|---|
| Hardware (Strom) | 2 bis 4 EUR (Laptop im Dauerbetrieb) |
| API | 0 EUR (Ollama) oder 1 bis 3 EUR (GPT-5 nano) |
| Tool Gateway | 0 EUR (Web-Suche kostenlos) |
| Channels | 0 EUR (CLI + Telegram-Bot) |
| Gesamt | 0 bis 5 EUR/Mo. |
Szenario 2: Power-User (15 bis 30 EUR/Mo.)
Du nutzt Hermes täglich, mehrere Skills, Cloud-LLM für Qualität. Telegram- und Discord-Bot laufen auf deinem Hauptrechner oder einem kleinen VPS.
Posten | Kosten |
|---|---|
| Hardware (Strom) | 3 bis 5 EUR |
| API (Claude Sonnet 4.6 oder Haiku) | 10 bis 20 EUR |
| Tool Gateway (Bildgenerierung, TTS) | 0 bis 5 EUR |
| VPS (optional, Hetzner CX22) | 0 oder 4,85 EUR |
| Gesamt | 15 bis 30 EUR/Mo. |
Szenario 3: Multi-Channel-Profi (50 bis 150+ EUR/Mo.)
Du betreibst mehrere Bots gleichzeitig. WhatsApp via Twilio, Telegram, Discord, E-Mail. Mehrere Cloud-LLMs für unterschiedliche Skills. 24/7-Hosting.
Posten | Kosten |
|---|---|
| VPS (Hetzner CX32 oder höher) | 7 bis 30 EUR |
| API (Claude Opus + GPT-5.5 + Sonnet) | 30 bis 80+ EUR |
| Tool Gateway (Cloud Browser, Bildgen) | 5 bis 20 EUR |
| Twilio (WhatsApp, SMS) | 5 bis 15 EUR |
| Domain + SSL | 1 bis 2 EUR |
| Backups + Monitoring | 3 bis 5 EUR |
| Gesamt | 50 bis 150+ EUR/Mo. |
Ab diesem Bereich solltest du dir ehrlich überlegen, ob Hermes Agent noch die richtige Wahl ist. Für reine Endkonsum-Nutzung wäre ein Claude-Max-Abo (100 USD pro Monat) wartungsärmer. Hermes lohnt sich hier nur, wenn du echte Multi-Channel-Workflows brauchst, die du sonst auf mehrere Tools verteilen müsstest.
Versteckte Kosten, die dir keiner sagt
Strom für lokale Modelle
Ein leiser Killer der Hobby-Rechnung. Ein Mac Mini M4 im Dauerbetrieb mit Ollama-32B-Modell verbraucht etwa 30 Watt, das sind rund 8 EUR pro Monat. Ein Gaming-PC mit RTX 4090 unter Volllast landet eher bei 25 bis 35 EUR pro Monat allein für Strom.
Wer die Stromkosten unterschätzt, wundert sich, warum „kostenlos via Ollama“ am Ende doch nicht ganz kostenlos war.
Tool-Gateway-Token bei selbstverbessernden Skills
Hermes lernt mit der Nutzung. Selbstverbessernde Skills laufen aber nicht magisch. Sie ziehen im Hintergrund weitere API-Aufrufe, um sich zu evaluieren und zu optimieren. Bei intensiv genutzten Skills kommen so pro Monat schnell 50 bis 200 zusätzliche LLM-Calls zusammen.
Channel-Hosting (Twilio, Discord-Bot, Mailserver)
Die Channels selbst sind je nach Plattform unterschiedlich teuer. Telegram, Discord, Signal und Home Assistant sind kostenlos. WhatsApp läuft typischerweise über Twilio (ab 0,005 USD pro Nachricht plus Meta-Template-Gebühren, die in Deutschland für Marketing-Templates über 0,10 EUR liegen). SMS ebenfalls über Twilio (ab rund 0,10 EUR pro Nachricht nach Deutschland). E-Mail braucht entweder einen eigenen Mailserver oder einen SMTP-Anbieter wie SendGrid (Essentials-Plan ab 19,95 USD pro Monat für 50.000 Mails, oder 100 Mails pro Tag kostenlos im Free-Tier).
Hermes Agent vs. ChatGPT Plus vs. Claude Pro: Was lohnt sich?
Hermes Agent (Power-User) | ChatGPT Plus | Claude Pro | |
|---|---|---|---|
| Monatliche Kosten | 15 bis 30 EUR | 23 EUR (20 USD) | 23 EUR (20 USD) |
| KI-Modell | Frei wählbar (40+ Provider) | GPT-5 (mit Limits) | Claude Sonnet 4.6 + Opus (mit Limits) |
| Multi-Channel | Ja (9+ Plattformen) | Nein | Nein |
| Persistentes Memory | Ja (sessionübergreifend) | Eingeschränkt | Eingeschränkt |
| Selbstverbessernde Skills | Ja | Nein | Nein |
| Datenschutz (DSGVO) | Volle Kontrolle (lokal möglich) | US-Unternehmen | US-Unternehmen |
| Setup-Aufwand | Mittel (10 bis 20 Min.) | Null | Null |
Bis etwa 30 EUR API-Verbrauch pro Monat ist Hermes günstiger und flexibler. Ab 50 EUR Gesamtkosten wird ein Abo unkomplizierter, sofern du nur einen einzigen Channel brauchst und keine Multi-Plattform-Bots betreiben willst.
Für einen breiteren Vergleich mit anderen Agent-Frameworks findest du in meinem Vergleich der OpenClaw-Alternativen auch Hermes Agent als Adaptive-Agent-Marktführer.
5 Tipps, um deine Hermes-Agent-Kosten zu senken
Egal welches Setup du fährst, mit diesen fünf Tipps holst du mehr aus deinem Budget:
- Setze einen Fallback-Provider ein: Hermes wechselt automatisch zu einem günstigeren Provider, wenn der Hauptprovider rate-limited ist. Konfiguriere GPT-5 nano oder Claude Haiku als Fallback hinter Claude Sonnet.
- Aktiviere Prompt-Caching: Sowohl Anthropic als auch OpenAI bieten Caching für wiederholte Prompts. Das senkt Input-Token-Kosten um 50 bis 90 Prozent bei wiederholt genutzten Skills.
- Lokal für Routine, Cloud für Komplexes: Konfiguriere Ollama für einfache Antworten (z. B. Status-Reports, kurze Zusammenfassungen) und Claude Sonnet nur für komplexe Aufgaben.
- Setze Token-Limits pro Skill: Selbstverbessernde Skills mit Memory-Update können unkontrolliert wachsen.
hermes auth limitssetzt harte Obergrenzen. - Vermeide unnötiges Cloud-Hosting: Wenn dein Rechner ohnehin 16 Stunden am Tag läuft, brauchst du keinen VPS. Der Gateway-Dienst läuft lokal genauso zuverlässig.
Wenn du jetzt loslegen willst, startet meine Schritt-für-Schritt-Anleitung in Hermes Agent installieren.






