Skip to content

Personal Agent vs. Hermes Agent — Detaillierter Feature-Vergleich

Ein gründlicher 1:1-Vergleich zwischen Personal Agent (dieses Repo) und Hermes Agent von Nous Research (github.com/NousResearch/hermes-agent, "The agent that grows with you"). Grundlage ist eine direkte Quellcode-Analyse beider Repositories (Hermes @ main, Stand Juni 2026, v0.17.x).

Beide Systeme sind selbst-hostbare, tool-nutzende KI-Agenten — aber mit grundverschiedener Philosophie. Personal Agent ist eine multi-tenant, governance-zentrierte SaaS-Plattform mit durable Execution. Hermes Agent ist ein single-operator, self-improving Autonomous Agent mit extrem breiter Plattform-/Provider-Reichweite und einem eingebauten Lern-Loop.

Legende: ✓ = vorhanden / first-class · ◑ = teilweise / via Add-on / nicht first-class · ✗ = nicht vorhanden · — = nicht zutreffend.


1. TL;DR — Die Kernunterschiede

Dimension Personal Agent Hermes Agent
Grundphilosophie Multi-Tenant SaaS-Plattform, Governance-first Single-Operator Autonomous Agent, "grows with you"
Killer-Feature Durable Runs (Temporal) + Fail-closed Data-Governance Self-Improving Learning Loop (Skills aus Erfahrung)
Ausführungsmodell Inline ODER durable (Temporal), ein AG-UI-Envelope Synchroner In-Process-Loop (run_agent.py)
State-Persistenz PostgreSQL + pgvector + Redis SQLite (WAL + FTS5), Dateien in ~/.hermes
Mandantenfähigkeit Echte Multi-Tenancy (RLS, Org-Validation) Single-Operator, per-User-Session-Isolation im Gateway
Reichweite Messaging 5 Kanäle (Email, Signal, WhatsApp, Matrix, Zulip) 16+ Plattformen (Telegram, Discord, Slack, Teams, …)
Modell-Provider pydantic-ai-Provider (~10), governance-getaggt 29+ Provider-Plugins, OpenRouter 200+ Modelle
Memory-Modell Bitemporaler Entity-State-Graph (World-Memory) 8 pluggable Memory-Provider + FTS5-Session-Suche
Erweiterbarkeit HA-Style Integrations (Manifest + Config Flow) Plugin- + Skill- + MCP-System
Frontend Quasar/Vue 3 SPA (German-first) React-Dashboard + Ink-TUI + Electron-Desktop
Lizenz / Modell Self-hosted Plattform-Produkt MIT, Open Source, Community (agentskills.io)
Reife (Code) Production-ready Kern, exp. Clients v0.17, ~1.600 Testdateien, sehr aktiv

In einem Satz: Personal Agent gewinnt bei Sicherheit, Governance, Durability und Mandantenfähigkeit; Hermes Agent gewinnt bei Lernfähigkeit, Plattform-/ Provider-Breite und Out-of-the-box-Reichweite.


2. Architektur & Ausführungsmodell

Feature Personal Agent Hermes Agent
Agent-Runtime pydantic-ai 1.x OpenAI-SDK-basierter eigener Loop
Durable / krash-sichere Runs ✓ (Temporal Workflows) ✗ (synchroner In-Process-Loop)
Zwei Run-Pfade (inline + durable) ✗ (nur in-process)
Replay / Resume nach Crash ✓ (Temporal History + CAN) ◑ (Session-Resume aus SQLite)
Einheitlicher Streaming-Envelope ✓ (AG-UI über Redis Streams) ◑ (plattform-/transport-spezifisch)
Continue-As-New für lange Runs
Interrupt / Ctrl+C-Handling ✓ (first-class im Loop)
Budget-Tracking (Iteration + Token) ✓ (USD-Caps) ✓ (Iteration + Token-Budget)
Context-Kompression in-flight ✓ (bei 85% Threshold)
Prompt-Caching-Strategie ✓ (cache-stabil pro Conversation, load-bearing)

Personal Agent trennt sauber zwischen inline (FastAPI-Background-Task) und durable (Temporal ChatAgentWorkflow) — beide emittieren identische AG-UI-Events auf einen per-Run Redis-Stream (Replay via Last-Event-Id). Das ist der zentrale Architektur-USP: ein Agent-Run überlebt API-Neustarts.

Hermes Agent fährt einen bewusst synchronen Loop (run_agent.py, ~5.500 LOC) ohne async im Kern — das vereinfacht Unterbrechung und Rollback, opfert aber Crash-Durability. Dafür ist das Prompt-Caching ein zentrales Design-Constraint: der System-Prompt ist byte-stabil über die Session, Toolsets werden nie mid-conversation getauscht.


3. Konversation & Agent-Core

Feature Personal Agent Hermes Agent
LLM-Chat-Agent
Streaming-Antworten
Reasoning-Modi (Off/Low/Med/High) ✓ (reasoning content)
Vision / Bildverständnis ✓ (vision_tool.py)
Checkpoint / Rewind ✓ (/retry, /undo, Session-Branching)
Best-of-N / mehrere Attempts ◑ (Branching)
Goal-Loop (iterative Verfolgung) ✓ (/goal) ◑ (autonom via Loop + Cron)
Slash-Commands ✓ (20+) ✓ (zentrales COMMAND_REGISTRY)
Sub-Agenten / Delegation ✓ (explore/delegate/script) ✓ (delegate_task, leaf/orchestrator)
Parallele Sub-Agent-Batches ✓ (delegate_many) ✓ (max_concurrent_children)
Spawn-Tiefe begrenzbar ✓ (max_spawn_depth)
Mehrere Chat-Modi ✓ (Standard/Coding/Custom) ◑ (TUI/CLI/Dashboard, kein Coding-Modus mit LSP)

Beide haben ein reichhaltiges Agent-Core mit Sub-Agenten. Unterschied: Personal Agent gibt jedem Sub-Agent eine eigene run_id + DB-Row + unabhängiges Usage-Tracking (gated durch das eigene Provider-Modell), während Hermes auf synchrone Parent-wartet-auf-Child-Delegation mit isoliertem Context/Terminal pro Sub-Agent setzt.


4. Memory & Wissen

Feature Personal Agent Hermes Agent
Persistentes User-Memory ✓ (World-Memory) ✓ (Memory-Provider)
Memory-Modell Bitemporaler, kausaler Entity-Graph Pluggable Provider + Session-Store
Pluggable Memory-Backends ✗ (ein integriertes Modell) ✓ (8: Honcho, Mem0, Supermemory, …)
Dialektisches User-Modeling ◑ (Curator lernt Fakten) ✓ (Honcho-Dialektik)
Live-Integration-Entities im Graph ✓ (Lichter, Sensoren, Tasks …)
Bitemporale Zeitachsen / Time-Travel
Provenance / Read-Propose-Write-Split
Cross-Session-Volltextsuche ◑ (RAG/pgvector) ✓ (SQLite FTS5 + LLM-Summary)
Knowledge-Page / Graphview-UI
Memory-Zugriffskontrolle pro Chat ✓ (Full/None/Restricted) ◑ (skip_memory in Cron)

Das ist ein fundamentaler Architekturunterschied. Personal Agent modelliert Wissen als einen bitemporalen Entity-State-Graph, der Live-Integration-Daten (Smart-Home-Zustände, Kalender-Tasks) und gelernte Langzeitfakten vereint — inkl. Time-Travel und Provenance. Hermes setzt auf austauschbare Memory-Provider (Honcho für dialektisches User-Modeling ist der Default-Star) plus eine SQLite-FTS5-Volltextsuche über alle vergangenen Sessions.


5. Das Alleinstellungsmerkmal jeder Seite

Hermes: Self-Improving Learning Loop

Feature Personal Agent Hermes Agent
Autonome Skill-Erstellung aus Erfahrung ✓ (nach komplexen Tasks)
Skills verbessern sich bei Nutzung ✓ (LLM-guided patches)
Skill-Lifecycle-Curator ◑ (Aging active/stale/archived) ✓ (use/view/patch-count, auto-archive)
Skill-Marketplace / Hub ✓ (curated catalogs) ✓ (agentskills.io, publish/install)
SKILL.md-Standardformat ✓ (Claude-kompatibel) ✓ (eigenes Frontmatter-Schema)

Hermes' namensgebendes Feature: Der Agent schreibt nach komplexen Aufgaben selbst Skills (strukturierte Markdown-Playbooks), verbessert sie bei wiederholter Nutzung und archiviert ungenutzte automatisch. Personal Agent hat zwar ein Skill-System mit Aging und Marketplace, aber kein autonomes Self-Authoring — Skills werden importiert/kuratiert, nicht vom Agent selbst aus Erfahrung generiert.

Personal Agent: Durability + Fail-closed Governance

Feature Personal Agent Hermes Agent
Echte Multi-Tenancy (Org-Isolation)
Postgres RLS als Defense-in-Depth
Fail-closed Data-Classification-Gate
Durable Agent-Runs (Temporal)
Untrusted-Content-Tool-Gating ✓ (automatisch) ◑ (Approval-Prompts)
Provider-Governance-Tags (local/eu/no-train)
BYOK Envelope-Encryption ◑ (.env-Secrets)

Personal Agents namensgebendes Feature ist vertrauenswürdige, mandantenfähige Ausführung: ein einziges fail-closed enforce_classification-Gate stellt sicher, dass klassifizierte Daten nie einen ungecleared Provider erreichen — und das an jedem Modell-Resolution-Entry (inline, durable, Workflows, Comms).


6. Tool-System & Code-Ausführung

Feature Personal Agent Hermes Agent
First-Party-Tool-Bibliothek ✓ (50+ Core-Tools)
Terminal / PTY-Ausführung ✓ (Coding-Modus, jailed) ✓ (terminal_tool.py)
Mehrere Execution-Backends ◑ (Device-Agent, Cloud-Sandbox) ✓ (local/docker/SSH/Singularity/Modal/Daytona)
Cloud-Sandbox on-demand ✓ (Playwright) ✓ (Modal/Daytona, near-zero idle)
Browser-Automatisierung ✓ (Extension + Playwright) ✓ (Browserbase/agent-browser/Camofox)
Code-Execution (Python/Shell/Node) ✓ (code_execution_tool.py)
Bild-Generierung ✓ (FAL, Nous Portal Gateway)
Vision / OCR
Mixture-of-Agents (MoA) ✓ (moa_tool.py)
Home-Assistant-Steuerung ✓ (eigenes Integrationsmodell) ◑ (homeassistant_tool.py)
Tool-Approval / Confirmations ✓ (Security-Modi) ✓ (approval.py, sudo-piping)

Hermes hat die breitere out-of-the-box Tool- und Backend-Palette (sechs Terminal-Backends inkl. serverless Modal/Daytona, drei Browser-Engines, MoA). Personal Agent setzt auf ein stärker abgesichertes Modell: Device-Agent mit jailed FS + PTY, Cloud-Sandbox, und Tool-Gating nach Provider-Tags + Untrusted-Content-Policy.


7. Integrationen, Messaging & Reichweite

Kanal / Integration Personal Agent Hermes Agent
Messaging-Plattformen gesamt 5 16+
Telegram
Discord
Slack
WhatsApp
Signal
Email (IMAP/SMTP)
Matrix / Element
Microsoft Teams
Feishu / Lark / DingTalk
WeChat (Official + Work)
Google Chat
Mattermost
Zulip
SMS / QQ / Yuanbao / BlueBubbles
OpenAI-kompatibler API-Server ◑ (eigene API)
Voice (STT/TTS) ✓ (Admin-Modelle) ✓ (Whisper, Edge/ElevenLabs/MiniMax)
Unified Inbox / Triage ✓ (Cross-Channel-Threads) ◑ (Session pro Chat)
Human-approved Draft-Replies
Calendar (CalDAV) ◑ (Skill)
Projektmgmt (OpenProject) ◑ (Skill)
GitHub / GitLab ✓ (Skill/MCP)
Web-Suche ✓ (Tavily/Brave/DuckDuckGo) ✓ (Exa/Firecrawl/Parallel)
Wetter ✓ (Met.no) ◑ (Skill)
Smart-Home (Shelly etc.) ◑ (HA-Tool)

Hier liegt Hermes klar vorn bei der reinen Reichweite: ein zentrales Gateway bedient 16+ Messaging-Plattformen simultan mit einheitlichem Session-Management. Personal Agent setzt dagegen auf ein tieferes Integrationsmodell (Home-Assistant-Style Manifest + Config Flow, capability-declared Entities), das eingehende Nachrichten in eine Unified Inbox mit Cross-Channel-Contact-Threads und Triage führt — qualitativ tiefer, aber bei weniger Kanälen.


8. Modell-Unterstützung & Routing

Feature Personal Agent Hermes Agent
Anzahl Provider ~10 (pydantic-ai) 29+ Plugins
OpenRouter (200+ Modelle) ◑ (über compat) ✓ (first-class)
Nous Portal ✓ (300+ Modelle, Tool-Gateway)
OpenAI / Anthropic / Google
AWS Bedrock
NVIDIA NIM / NovitaAI / MiniMax / Kimi / GLM
Lokale Modelle (Ollama etc.)
Auto-Modell-Auswahl ✓ (tag-ranked) ◑ (hermes model interaktiv)
Fallback-Ketten ✓ (provider-divers) ✓ (credential pool + fallback)
Aux-Modell pro Task (Curator/Vision/…) ✓ (auxiliary_client.py)
Kosten-/Pricing-Tracking ✓ (genai-prices + Audit-Table)
Budget-Caps (User/Org/Global)
Governance-Tag-Gating der Provider

Hermes gewinnt bei Provider-Breite (29+ Plugins, lazy-loaded, inkl. vieler chinesischer und Coding-Provider). Personal Agent gewinnt bei Kosten-Governance (versioniertes model_pricing für Audit, USD-Budget-Caps auf drei Ebenen, Provider-Governance-Tags, die Capabilities gaten).


9. Automatisierung & Proaktivität

Feature Personal Agent Hermes Agent
Geplante Jobs / Cron ✓ (Workflow-Trigger) ✓ (cron/, croniter)
Schedule-Formate ✓ (cron/interval/event) ✓ (duration/„every"/cron/ISO)
Workflows (ausführbare Skripte) ✓ (sandboxed Monty-Python) ◑ (Cron-Scripts + Skills)
Trigger-Typen ✓ (Schedule/Webhook/Event/Poll/Manual) ◑ (Cron + Plattform-Events)
Conditions (Entity-State/Time-Window)
Headless Background-Runs ✓ (Temporal Schedule) ✓ (Cron-Sessions)
Hooks (Before/After Tool/Message) ✓ (Guardrails) ◑ (Plugin-Lifecycle-Hooks)
Proaktive Agenda / Push ✓ (Agenda-Page + Curator) ◑ (Cron-Delivery an Plattform)
Batch-/Dataset-Runner ✓ (batch_runner.py, Trajectories)

Personal Agent hat das mächtigere deklarative Automatisierungs-Subsystem (Workflows = Skripte mit Triggers und Conditions, plus Hooks als Guardrails). Hermes' Cron ist robust (Hard-Interrupt, Catchup/Grace-Windows, Context-Chaining), aber ohne deklarative Conditions. Hermes hat dafür einen Batch-Runner zur Trainingsdaten-Generierung (Trajectories) — etwas, das Personal Agent nicht hat.


10. Erweiterbarkeit & Ökosystem

Feature Personal Agent Hermes Agent
MCP-Client (Server konsumieren) ✓ (OAuth, encrypted) ✓ (auto-discovery)
Als MCP-Server agieren ✓ (/api/mcp) ✓ (mcp_serve.py)
OpenAPI-Spec → Tools
Plugin-System ◑ (Integrations) ✓ (umfangreich: memory/model/browser/…)
HA-Style Integrationen (Manifest+Flow)
Skill-Hub / Community-Katalog ✓ (agentskills.io)
ACP (IDE-Integration VS Code/Zed) ✓ (acp_adapter/)
Drittanbieter-Plugin-Repos ✓ (pip entry points, ~/.hermes/plugins)

Beide haben starke MCP-Unterstützung in beide Richtungen. Hermes' Plugin-System ist breiter (Memory-Provider, Modell-Provider, Browser, Image-Gen, Context- Engines als Plugins) und bietet ACP für IDE-Integration. Personal Agents Integrations-Modell ist strukturierter (Home-Assistant-Style mit Config Flow, capability-declared Entities, die direkt in Memory-Graph + Triage einfließen).


11. Sicherheit & Governance

Feature Personal Agent Hermes Agent
Multi-Tenancy mit Org-Isolation
Postgres RLS
OIDC / Keycloak SSO ◑ (Plattform-OAuth)
Per-User-Allowlists ✓ (Gateway, deny-by-default)
Data-Classification (fail-closed)
Untrusted-Content-Tool-Gating ✓ (automatisch) ◑ (Approval)
BYOK Envelope-Encryption
Security-Modi (Autonomous/Approve/Judge) ◑ (Approval-Prompts)
LLM-Judge für Tool-Calls ✓ (Guard-Modell)
Supply-Chain-Hardening (Pinning) ✓ (== Pins, git-SHAs, CI-Gate)
Sandbox-Boundaries ✓ (jailed FS/PTY) ✓ (Backend = Boundary)

Personal Agent ist hier klar das governance-zentrierte System — echtes Multi-Tenancy, RLS, fail-closed Klassifikation, drei Security-Modi inkl. LLM-Judge, automatisches Untrusted-Content-Gating. Hermes glänzt bei Supply-Chain-Härtung (exakte Versions-Pins, git-Commit-SHAs, CI lehnt ungedeckelte Deps ab — Reaktion auf Worm-/Compromise-Vorfälle 2026) und bei deny-by-default Gateway-Allowlists.


12. Plattformen & Clients

Client Personal Agent Hermes Agent
Web-SPA ✓ (Quasar/Vue 3, PWA) ✓ (React/Vite)
Terminal-UI (TUI) ✓ (Rust/ratatui) ✓ (Ink/React + tui_gateway)
Klassische CLI ✓ (prompt_toolkit)
Desktop-App ◑ (Electron, experimentell) ✓ (Electron + React, apps/desktop)
Android-App ◑ (experimentell, Companion) ◑ (via Termux)
Browser-Extension ✓ (Chrome MV3, Device) ◑ (Browser-Automation, nicht als Client)
Device-Agent (Rust, jailed)
Eingebettetes Terminal im Web ◑ (Coding-Modus) ✓ (xterm.js + PTY-Bridge)
Sprachen / i18n German-first + EN 16 Sprachen

Hermes deckt mehr Client-Formfaktoren von Haus aus produktiv ab (CLI, TUI, Web, Desktop, Termux) und lokalisiert in 16 Sprachen. Personal Agent hat dafür den Rust-Device-Agent (jailed FS + PTY auf dem eigenen Rechner) und eine Phone-Companion-App mit Sensoren/Health/Location als echte Integration — Fähigkeiten, die Hermes so nicht bietet.


13. Tech-Stack im Direktvergleich

Komponente Personal Agent Hermes Agent
Sprache (Backend) Python 3.12 Python 3.11–3.13
Agent-Framework pydantic-ai 1.x OpenAI-SDK + eigener Loop
Web-Framework FastAPI FastAPI + Uvicorn
Datenbank PostgreSQL + pgvector SQLite (WAL + FTS5)
Message-Bus Redis (Streams + Pub/Sub) — (in-process / SQLite)
Durable Execution Temporal
Auth Keycloak / OIDC Plattform-OAuth / Tokens
Frontend Quasar / Vue 3 React + Ink + Electron
Paketmanager uv (Workspace) uv
Deployment Compose, K8s/Helm, CNPG, KEDA Docker (s6), Nix flake, VPS, Modal/Daytona
Observability Logfire / OpenTelemetry Plugin (plugins/observability)
Versionierung CalVer (YYYY.M.MICRO) SemVer (0.17.x)

Der Stack-Unterschied spiegelt die Philosophie: Personal Agent ist eine verteilte, server-zentrierte Plattform (Postgres, Redis, Temporal, K8s), Hermes ist ein portabler Single-Process-Agent (SQLite, läuft auf einem $5-VPS oder serverless mit near-zero idle cost).


14. Reife & Status

Aspekt Personal Agent Hermes Agent
Versionsstand CalVer, Kern production-ready v0.17.x, sehr aktiv
Testabdeckung Unit + Integration + LLM-Evals ~1.600 Testdateien, ~17k Tests, E2E
Experimentelle Teile Android/Desktop/Extension (außerhalb CI) wenige (Kern stabil)
Lizenz Self-hosted Plattform MIT (Open Source)
Community/Ökosystem intern, roadmap-getrieben groß (Discord, agentskills.io)
Deployment-Reife Compose + Helm-Umbrella + CNPG/KEDA Docker + Nix + Cloud-Backends

15. Wann welches System?

Wähle Personal Agent, wenn: - Du mehrere Nutzer/Organisationen mit echter Daten-Isolation bedienst. - Daten-Governance & Compliance kritisch sind (klassifizierte Daten dürfen bestimmte Provider nie erreichen; EU/local-only Provider-Tags). - Agent-Runs Crashs überleben müssen (lange, durable Aufgaben via Temporal). - Du ein tiefes, einheitliches Wissensmodell willst (bitemporaler Entity-Graph, der Smart-Home-Zustand + Kalender + gelernte Fakten vereint). - Du Workflows mit Triggern und Conditions plus Guardrail-Hooks brauchst.

Wähle Hermes Agent, wenn: - Du einen persönlichen Agenten für dich selbst willst, der mit dir lernt (autonome Skill-Erstellung, dialektisches User-Modeling). - Du maximale Plattform-Reichweite brauchst (Telegram/Discord/Slack/Teams/ WeChat/… aus einem Gateway). - Du maximale Modell-Provider-Auswahl willst (29+ Provider, OpenRouter 200+). - Du leichtgewichtig & portabel deployen willst ($5-VPS, Termux, serverless). - Du ein offenes Ökosystem mit Community-Skills/-Plugins (agentskills.io) und IDE-Integration (ACP) schätzt.

Konvergenz / gegenseitige Inspiration: Beide teilen viel DNA — SKILL.md-Skills, MCP in beide Richtungen, Sub-Agenten, Context-Kompression, Multi-Provider-Routing, Cron/Scheduling. Personal Agent könnte von Hermes' autonomem Skill-Self-Authoring und der Messaging- Breite lernen; Hermes könnte von Personal Agents durable Execution, fail-closed Governance und bitemporalem Memory-Graph profitieren.


Erstellt durch direkte Quellcode-Analyse beider Repositories. Die Hermes-Seite basiert auf NousResearch/hermes-agent @ main (v0.17.x, Juni 2026); einige Fähigkeiten leben dort in Plugins/Skills/optional-mcps statt im Kern. Der Vergleich ist notwendigerweise eine Momentaufnahme — beide Projekte bewegen sich schnell.