
今年2月初我曾写过OpenClaw的文章,我就不在这里追溯了。Hermes Agent是由硅谷AI实验室Nous Research于2026年2月开源的自进化AI智能体框架,其核心定位是“与你共同成长的智能体”。与追求广度的OpenClaw不同,Hermes追求深度,通过内置的学习闭环系统实现真正的自我进化。

一、核心设计哲学:从工具到伙伴。Hermes的设计理念颠覆了传统AI Agent的范式。大多数Agent本质上是“用完归零的工具”,每次会话都从零开始。而Hermes构建了一个闭环学习系统,让AI智能体第一次真正具备了“从经验中学习、在实践中进化”的能力。它不是又一个封装LLM API的工具库,也不是简单的任务自动化脚本,而是一个会成长的智能体——它能记住你的偏好、自动创建技能、跨会话检索记忆、在对话中自我改进,甚至能在完成任务后将自己的最佳实践固化为可复用的技能模块。
二、技术架构:单体引擎,多端接入。统一的核心引擎。Hermes的架构设计遵循“一次编写,处处运行”的原则。无论是命令行、Telegram消息,还是IDE插件,背后都是同一个Agent引擎在驱动。其项目结构清晰,职责分明:入口层。核心层。能力层:47个内置工具、6种终端后端、5种浏览器后端、4种Web后端、MCP动态集成、15+消息平台适配器。Agent循环的核心逻辑。run_agent.py中的Agent循环遵循ReAct模式,但增加了Hermes特有的增强:1.组装系统提示:加载身份定义、相关记忆检索、匹配的技能、上下文文件。2.调用LLM:使用当前模型处理用户输入和工具调用。3.处理工具调用:执行工具并收集结果。4.反馈循环:将工具结果反馈给LLM进行下一轮推理。

三、学习循环:闭环反馈系统。学习循环是Hermes最核心的创新,它包含四个动态部分,在每个会话的不同时间点触发:由Agent管理的内存与定期提醒。Hermes通过“定期提醒”机制让Agent自己决定什么值得保留。在会话期间的设定间隔,Agent会收到一个内部系统级提示,要求它回顾发生的事情并评估是否有任何内容值得持久化到内存中。这会在没有用户输入的情况下触发,Agent会扫描最近的活动,如果有任何内容跨越了在未来会话中有用的阈值,就会将其写入内存文件。自主技能创建。当Agent完成任务时,它会检查所采取的路径是否值得记录。触发条件很具体:五次或更多工具调用、从错误中恢复、用户纠正,或者奏效的非明显工作流。如果检查通过,它会在~/.hermes/skills/中创建一个技能文件——不是日志条目,而是一个可复用的指令集,Agent可以在未来的会话中遵循,无需重复原始步骤。

技能自我优化。技能一旦写入就不会被冻结,Agent会继续使用它们,在执行过程中找到更好的路径时进行更新。通过skill_manage工具可以使用六种技能操作:create、patch、edit、delete、write_file和remove_file。Agent默认对大多数更新使用patch,通过只传入旧字符串和替换字符串来进行有针对性的更改,这意味着只有更改的文本会出现在工具调用中,而不是完整的技能内容。基于FTS5的会话搜索与LLM摘要。每个会话都会被写入SQLite存档,并使用FTS5进行索引,因此Agent可以搜索过去的上下文,而不是将整个旧会话加载到窗口中。检索到的结果在注入之前会经过LLM摘要处理,因此只有与当前任务相关的内容才会被引入。

四、四层记忆系统Hermes采用精心设计的四层记忆架构,每层都有特定的职责、磁盘位置和读取时机:
层级 | 名称 | 存储位置 | 功能 | 触发时机 |
第一层 | 常驻提示记忆 | ~/.hermes/memories/ | MEMORY.md和USER.md,存放需要在每次会话开始时自动加载的上下文 | 会话开始时自动加载 |
第二层 | 会话归档
| SQLite数据库+FTS5索引 | 每次对话写入数据库,用全文索引检索历史上下文 | Agent主动发起查询时 |
第三层 | 技能程序性记忆 | ~/.hermes/skills/ | 可复用的技能文件,包含解决问题的具体方法 | 按需加载,渐进式披露 |
第四层 | Honcho用户建模 | 可选外部后端 | 被动积累用户偏好、沟通风格和领域知识 | 长期使用场景
|

设计精妙之处。字符限制:MEMORY.md和USER.md总字符数限制为3,575个,故意收窄以强迫筛选而非积累。渐进式披露:默认只加载技能名称和简短描述,全文按需调入,技能库增长而上下文成本几乎不变。缓存感知:不会因为Agent学习更多内容而不断增加Token费用。

五、技能系统:程序性记忆的沉淀。技能系统是Hermes将经验固化为能力的核心机制:技能文件结构。每个技能文件遵循agentskills.io开放标准,包含名称、简短描述、涉及的步骤,以及作为工作流一部分的任何工具调用或文件引用。这种结构使得技能可以在兼容的Agent之间移植。技能创建流程。任务完成:Agent完成复杂任务。路径分析:自动分析成功路径。技能提取:将工作流程提取为带有YAML元数据的Markdown文件。存储优化:存储在~/.hermes/skills/目录下,便于后续检索和复用。实际效果。根据Nous Research的内部测试,使用Hermes的闭环学习系统后:重复任务效率提升340%:第一次需要10分钟完成的任务,第五次只需3分钟。技能复用率达到78%:在开发场景中,78%的复杂任务可以通过已有技能组合完成。错误率下降62%:通过记忆历史错误,避免重复踩坑。

六、网关与平台支持。多平台消息网关。Hermes的网关是一个持久的后台服务,让Agent在你配对的每个平台上保持运行和连接。它支持15+消息平台,包括CLI、Telegram、Discord、Slack、WhatsApp、Signal、Email等。在Telegram上开始的对话可以在终端中继续,因为会话绑定的是ID,而不是平台。网关的核心功能。gateway/目录处理五件事:消息传递:平台间的消息路由和投递。会话路由:跨平台会话连续性。交付:确保消息可靠到达。配对:将新平台与Agent实例关联。定时触发:在正确时间触发定时自动化

七、应用场景与优势。适用场景。个人数字助理:长期陪伴、记忆偏好、自动学习工作习惯。开发者自动化:运行终端命令、管理文件、搜索网页、运行代码。研究与分析:利用网页搜索和内容提取功能进行深度研究。团队协作:在Slack或Discord中提供智能协助。MLOps与AI训练:生成训练数据、运行RL实验、导出轨迹用于微调。核心优势。真正的自我进化:不是通过配置更新,而是通过实际使用来进化。跨会话持久记忆:FTS5全文检索+LLM摘要实现智能记忆检索。技能自动沉淀:将成功经验固化为可复用的程序性记忆。平台无关性:运行在任意基础设施,通过任意消息平台对话。完全开源自托管:MIT协议,数据本地存储,无遥测无追踪。八、技术实现细节。模型支持。Hermes支持200+大语言模型。执行环境。安全设计。

九、总结:AI Agent的新范式。Hermes Agent代表了AI Agent发展的新方向——从“用完归零的工具”转变为“能从失败里学到东西、能记住教训的伙伴关系”。它通过三层协同机制实现真正的“越用越聪明”:记忆层:五层记忆体系提供从短期工作台到长期用户画像的完整认知结构。技能层:自动Skill生成将每次成功经验固化为可复用的“能力资产”。学习层:闭环学习让Agent能力在每次使用后持续迭代,无需人工干预。与OpenClaw追求“广度”不同,Hermes追求“深度”,让Agent在长期使用中不断进化,真正成为与你共同成长的搭档。这正是Hermes在不到两个月内狂揽6万+GitHub Star的原因——它回答了一个所有开发者都在关心的问题:Agent能不能“记住”和“变强”?

Hermes Agent的五层安全防线采用纵深防御(defense-in-depth)架构,每层都是框架级的硬逻辑实现,不依赖AI模型的判断。以下是各层的具体实现机制:第一层:用户授权检查。实现机制:控制谁能与Agent对话,支持两种主要模式:Allowlist(白名单):在配置文件中明确指定允许访问的用户ID或群组ID。DM Pairing(私聊配对):首次交互时建立信任关系,后续仅限已配对的私聊会话。技术细节:所有操作都会检查当前用户的权限级别,可配置哪些操作需要确认、哪些可以自动执行。生产环境强烈建议关闭GATEWAY_ALLOW_ALL_USERS=true选项。

第二层:危险命令审批。实现机制:对高风险命令强制要求人工确认,支持三种审批模式:manual(默认):始终提示用户审批危险命令。smart:使用辅助LLM评估风险,低风险命令自动批准,高风险自动拒绝,不确定情况升级到人工审批。off:禁用所有审批检查(仅限受信任环境如CI/CD、容器等)。危险命令检测。审批方式:支持四种审批粒度:once(单次)、session(会话内)、always(始终)、deny(拒绝)。第三层:容器隔离。实现机制:提供可选的Docker执行环境,采用多重硬化参数:只读根目录:防止文件系统被恶意修改。权限降级:以非root用户身份运行命令。PID限制:控制进程数量。能力丢弃:使用cap-drop ALL移除所有Linux能力。无新权限:设置no-new-privileges防止权限提升。后端支持:除了Docker,还支持Singularity、Modal和远程SSH后端。

第四层:MCP凭证过滤。实现机制:当Agent通过Model Context Protocol(MCP)调用外部工具时,自动过滤敏感凭证:环境变量隔离:MCP子进程默认只能看到安全的环境变量。凭证保护:防止API密钥、访问令牌等敏感信息泄露给不可信的子进程。细粒度控制:可配置哪些凭证允许传递给特定工具。第五层:上下文文件扫描。实现机制:内置Tirith扫描引擎检测并阻止提示注入攻击:项目文件扫描:分析项目目录中的文件内容,检测潜在的恶意提示注入。实时检测:在Agent处理用户输入时进行实时扫描。告警拦截:发现可疑内容时发出告警并拦截执行。

额外安全层:技能免疫系统。除了运行时五层防线,Hermes还实现了skills_guard.py作为技能系统的免疫系统:威胁检测:内置90+种正则模式,检测技能内容中的可疑行为。密钥泄露检测:识别硬编码的API密钥。恶意命令检测:发现隐藏的curl数据窃取命令。危险操作检测:标记未经确认的rm -rf等操作。生产环境推荐配置。省略。这套安全架构的核心设计哲学是不信任原则——即使Agent被恶意提示劫持,框架级的硬逻辑也能确保系统安全边界不被突破。每层防线都针对特定攻击向量,共同构成完整的纵深防御体系。

OpenClaw和Hermes是当前最受关注的两个开源AI智能体框架,它们在设计哲学、技术实现和应用场景上存在显著差异。以下是两者的核心区别对比:
维度 | OpenClaw | Hermes Agent |
核心哲学 | 我能做很多事(广度优先)——强大的执行引擎/自动化网关 | 我会变得越来越懂你(深度优先)——自我进化的数字同事 |
开发团队
| 奥地利软件工程师彼得·斯坦伯格开发,后加入OpenAI | 硅谷AI实验室Nous Research开发
|
技术栈
| Node.js/TypeScript(代码量较大,架构复杂) | Python(代码轻量,可读性强)
|
核心架构
| 中心化网关架构(Gateway-Agent-Skills-Memory) | 智能体引擎架构(围绕AI推理与执行循环) |
技能系统 | 类似应用商店,依赖社区贡献的现成技能(ClawHub有13,700+技能) | 自学成才,自动从任务中生成并优化技能(遵循agentskills.io标准) |
记忆特性
| 短期、任务导向,文件即记忆(MEMORY.md+每日日志) | 长期、可反思、可提炼,三层记忆架构(情景/语义/程序记忆) |
学习能力
| 不具备从经验中学习的能力,需要人工编写/修改技能 | 内置闭环学习系统,自动从成功/失败任务中学习并固化能力 |
安全模型 | 依赖社区信任,第三方技能存在安全隐患(需沙箱机制) | 默认安全设计,五层防线(用户授权、危险命令审批等) |
支持平台
| 40+消息平台,包括WhatsApp、Telegram、Slack等 | 14+平台,亮点包括Home Assistant、钉钉、飞书等 |
模型支持
| 兼容OpenAI协议,对Anthropic有特殊优待 | 200+大模型,支持会话中途切换模型
|
适用场景 | 团队协作、企业自动化、标准化重复任务 | 个人用户深度陪伴、非结构化复杂问题、长期知识积累 |
部署方式 | 本地设备部署(macOS/Windows/Linux),云服务商提供一键部署 | 6种部署方式(5美元VPS、Docker、Serverless等)
|

选型建议:优先选择OpenClaw:需要在团队内部部署统一管理的AI网关;希望开箱即用,快速接入大量现成社区技能;需要与国内主流通讯平台无缝集成。优先选择Hermes Agent:Python开发者希望深入理解和定制Agent源码;需要真正的跨会话持久记忆;希望Agent越用越聪明,自动沉淀经验生成技能。两者并非取代关系,而是互补的解决方案。OpenClaw像“安卓”——开放、强大、什么都能接,但需要用户自己配置;Hermes像“苹果”——会悄悄替用户记住一切、学会一切,越用越顺。

对于新手入门,OpenClaw更适合,主要基于以下对比:
维度 | OpenClaw(更适合新手) | Hermes Agent |
安装复杂度 | 一行命令 npm install -g openclaw,有完整的 openclaw doctor 健康检查 | 同样支持一行命令安装,但依赖 Python 环境 |
配置向导
| 提供交互式 openclaw onboard 向导,引导完成模型、API 密钥、频道配置 | 提供 hermes setup 向导,但涉及更多高级选项(如模型路由、记忆配置) |
学习曲线 | 概念相对直观(网关、技能、频道),官方提供“5分钟快速上手”和“30分钟上手指南” | 概念更复杂(三层记忆、自学习循环、技能生成),需要理解更多抽象概念
|
文档与教程
| 文档结构清晰,有渐进式新手任务(14个任务约60分钟),覆盖从界面认识到文件操作的全流程 | 文档更偏向技术参考,缺少类似 OpenClaw 的渐进式任务引导
|
首次成功时间
| 按照官方“5分钟快速上手”,从安装到在 Telegram 收到第一条 AI 回复可在 5 分钟内完成 | 安装同样快速,但要让 Agent 真正“学会”并高效工作,需要更多配置和磨合时间 |
错误处理
| 提供明确的故障排查指南(如端口占用、API Key 问题) | 错误信息更偏向开发者,对新手不够友好 |
社区与支持 | 有活跃的中文社区和丰富的第三方教程 | 社区相对更技术向,中文资源较少
|

总结建议:如果你是纯新手,希望快速体验 AI 助手的基本功能(聊天、文件操作、多平台接入),选择 OpenClaw。它的“向导式配置”和“任务式学习”能让你在最短时间内获得成就感。如果你有一定技术背景,且希望 AI 助手能“越用越聪明”(自动沉淀经验、生成技能),选择 Hermes Agent。它的自学习能力在长期使用中价值更大,但初期需要更多耐心配置和理解概念。

快速入门 OpenClaw 的步骤:安装 Node.js 22+;运行 npm install -g openclaw@latest;运行 openclaw onboard --install-daemon 跟随向导配置;运行 openclaw gateway --port 18789 启动服务;按教程连接 Telegram 等平台即可开始对话。无论选择哪个,都建议从官方文档开始,遇到问题及时查阅社区或教程。
对于个人用户的选择,需要根据你的技术背景、使用习惯和长期需求来决定。以下是详细对比:核心定位差异
维度 | OpenClaw | Hermes Agent |
设计理念
| 广度优先:覆盖更多场景和平台,提供开箱即用的体验 | 深度优先:追求自我进化,越用越懂你
|
目标用户
| 希望快速上手的普通用户、多平台使用者 | 技术爱好者、长期数字伙伴需求者
|
学习成本 | 低(30分钟上手) | 中高(需要理解记忆、技能等概念) |

个人用户场景匹配度。1.推荐 OpenClaw 的场景。如果你符合以下特征:追求快速上手:希望安装后5分钟内就能开始使用。多平台重度用户:同时在Telegram、Discord、Slack等多个平台活跃。任务导向:需要AI帮忙处理具体的一次性任务(查资料、写代码、翻译等)。不喜欢折腾配置:希望有图形界面或简单命令行完成所有设置。短期试用心态:想先体验AI助手能做什么,再决定是否深度使用。OpenClaw的优势:完整的openclaw onboard交互式配置向导;内置健康检查openclaw doctor快速排查问题;丰富的第三方集成和插件生态;活跃的中文社区,问题解决速度快。

2.推荐 Hermes Agent 的场景。如果你符合以下特征:长期数字伙伴需求:希望AI能记住你的习惯、偏好和工作流。重复性任务多:经常需要处理类似的任务(周报生成、代码审查、数据分析等)。技术背景较强:不惧怕命令行和配置文件。重视隐私:希望所有数据完全本地存储,无任何云端同步。愿意投入学习时间:相信“磨刀不误砍柴工”,愿意花时间调教AI。Hermes的优势:真正的自我进化:通过闭环学习系统,使用越久越懂你;跨会话记忆:能记住几个月前的对话上下文;技能自动沉淀:将成功经验固化为可复用技能,效率指数级提升;完全本地化:所有记忆存储在~/.hermes/目录,零追踪零遥测。

实际使用体验对比。1.日常助手任务。场景:每周生成工作周报。OpenClaw:每次都需要重新描述格式要求、项目进展、下周计划。Hermes:第一次详细说明后,自动创建“生成周报”技能,后续只需说“写周报”即可。学习成本回报曲线。
OpenClaw:快速上手 → 平稳使用 → 遇到瓶颈(重复解释)
↑ ↑ ↑
第1天 第1周 第1个月
Hermes:较慢上手 → 逐渐适应 → 效率爆发(技能积累)
↑ ↑ ↑
第1天 第1周 第1个月

隐私保护对比
方面 | OpenClaw | Hermes |
数据存储 | 支持本地存储,部分功能可选云端 | 强制本地存储,无云端选项 |
遥测 | 可选匿名使用统计 | 完全无遥测 |
记忆控制 | 用户可管理记忆内容 | 用户+Agent共同管理记忆 |

成本考量。1.时间成本。OpenClaw:安装配置约15分钟,日常使用接近零维护。Hermes:安装配置约30分钟,初期需要“训练”Agent(约1-2周),后期维护成本低。2.经济成本。两者都需要自行配置API Key(OpenAI、Claude、DeepSeek等),成本主要取决于:模型使用费:两者都支持多种模型,成本相近。技能生成成本:Hermes的技能创建会消耗额外Token,但长期看能节省更多Token。

决策建议。选择 OpenClaw 如果:你是AI助手的新手,想先体验基础功能;你需要快速在多平台部署使用;你主要处理一次性、不重复的任务;你不希望花时间“训练”AI。快速开始命令:省略。选择 Hermes Agent 如果:你希望AI成为真正的长期数字伙伴;你经常处理重复性工作,渴望自动化;你有技术背景,不惧怕命令行;你对隐私有极高要求,希望完全自托管。快速开始命令:省略。折中方案:先OpenClaw后Hermes。许多用户的成功路径:第1个月:用OpenClaw熟悉AI助手的基本能力。第2-3个月:当发现重复解释需求增多时,迁移到Hermes。长期:享受Hermes的自我进化能力。

总结。OpenClaw像是“瑞士军刀”——功能全面、开箱即用、适合大多数日常场景。如果你是普通用户,希望快速获得一个能用的AI助手,选它。Hermes像是“终身学徒”——初期需要耐心教导,但会越来越懂你,最终成为不可替代的伙伴。如果你愿意投资时间,追求长期价值,选它。两者都开源免费,都支持本地部署,关键区别在于:你要的是“现在就能用”的工具,还是“越用越好用”的伙伴?根据这个核心问题,就能做出最适合自己的选择。

对于科研场景,OpenClaw和Hermes各有侧重,选择取决于具体研究需求:OpenClaw更适合以下科研场景:团队协作与标准化流程;专业领域深度应用;开箱即用的技能生态;企业级安全部署。Hermes Agent更适合以下科研场景:长期研究项目:其四层记忆系统(常驻提示记忆、会话归档、技能文件、用户建模层)支持跨会话连贯性,适合需要数月甚至数年持续跟踪的研究课题;自我进化需求;个人研究助手;前沿技术研究。选择OpenClaw:科研团队需要统一管理;涉及敏感数据需要安全部署;希望快速接入现成学术技能;专业领域有成熟应用案例(如医疗、制药)。选择Hermes Agent:个人研究者需要长期记忆陪伴;研究课题需要跨会话连贯理解;希望智能体越用越懂研究习惯;关注AI Agent技术本身的研究。两者并非互斥,大型科研机构可同时部署:OpenClaw用于团队标准化流程,Hermes用于个人深度研究辅助。

对于需要处理大量文献的科研项目,OpenClaw和Hermes Agent各有独特的优势定位。OpenClaw是“广度优先”的科研工具集,提供开箱即用的全流程自动化;Hermes是“深度优先”的进化伙伴,通过自学习和记忆系统实现越用越强的个性化支持。OpenClaw:全流程自动化工具集。文献检索与收集优势;内容提取与整理优势;科研流程集成优势;部署与生态优势。Hermes Agent:自进化研究伙伴。长期记忆与连贯性优势(四层记忆系统);自进化学习能力;深度集成与个性化;复杂分析场景优势。

对比总结与选型建议
维度 | OpenClaw(科研工具集) | Hermes Agent(进化伙伴) |
核心定位 | 广度优先,覆盖全流程 | 深度优先,追求自我进化 |
文献检索 | 跨库检索+条件筛选+批量下载 | 检索策略学习+个性化优化 |
内容管理 | 结构化提取+表格化整理 | 关联记忆+知识图谱构建 |
自动化程度 | 预设流程自动化 | 自学习流程优化 |
学习成本 | 低(30分钟上手) | 中高(需要“训练期”) |
团队协作 | 优秀(统一管理、格式规范) | 一般(更侧重个人化) |
长期价值 | 稳定高效的标准化工具 | 越用越懂你的研究伙伴 |
典型场景
| 实验室统一文献管理、生信分析流水线、论文格式规范化 | 个人长期研究项目、系统综述/Meta分析、跨学科探索 |

选型决策指南。选择OpenClaw如果:需要快速搭建实验室级文献管理系统;处理标准化流程的文献工作(如每周文献追踪、定期综述更新);涉及敏感数据需要安全可控的本地部署;团队需要统一格式规范和协作流程;希望利用现成技能生态,避免从零开发;选择Hermes Agent如果:进行长期研究项目(博士课题、专著写作等需要数月连贯性);处理复杂系统综述如Meta-Analysis,需要灵活的工作流;希望AI能深度学习你的研究习惯和领域知识;需要跨会话记忆,避免每次重新解释研究背景;重视个人知识库的构建和长期积累;

进阶方案:组合使用。许多顶尖实验室采用分层策略:团队层面:用OpenClaw管理共享文献库、标准化分析流程。个人层面:用Hermes Agent作为个人研究助手,深度理解特定课题。数据流:OpenClaw处理原始文献收集和初步整理 → Hermes Agent进行深度分析和知识关联。无论选择哪个,关键是根据研究项目的时间跨度、团队规模、个性化需求来决定。OpenClaw让科研“更快”,Hermes让科研“更懂你”。



