Hermes Agent 是 Nous Research 推出的开源 AI Agent 框架。它最独特的设计是——Agent 能 自己学会新技能并永久记住。本文是我 3 个月深度使用的完整经验。
安装完成后 Hermes 会引导你完成模型选择、工具开启、平台接入。整个过程约 5 分钟。
Hermes 的 消息网关 是其杀手锏功能。同一个 Agent 可以同时接入:
| 平台 | 配置 | 适用场景 |
|---|---|---|
| 微信 | iLink 协议,扫码配对 | 日常对话、家庭群助手 |
| Telegram | Bot Token | 快速指令、文件传输 |
| Discord | Bot Token + 权限 | 社区管理、技术讨论 |
| CLI | 终端原生 | 开发调试、服务器管理 |
| Web UI | API Server 模式 | 浏览器访问 |
我在 Ubuntu 服务器上部署 Hermes,接入微信作为主交互通道。日常工作流:
Skills 是 Hermes 最强大的特性:Agent 从经验中学习,将解决方案保存为可复用的技能文档。你纠正 Hermes 一次,它记住一种方法;下次自动加载。
hermes-agent:配置和扩展 Hermes 自身的知识deepseek-vision-base64:用 Base64 绕过 DeepSeek 不支持图片的限制photo-enhancement:AI 辅助照片增强工作流wechat-miniprogram-workflow:微信小程序完整开发到部署流程powerpoint:PPT 生成(风格、模板、自动化)Hermes 的 cron 功能让 Agent 从「被动响应」变成「主动服务」。
Hermes 内置了丰富的工具集(Toolset),可灵活开启/关闭:
| 工具集 | 能力 |
|---|---|
| terminal | Shell 命令执行、后台进程管理 |
| file | 文件读写、搜索、Patch 编辑 |
| browser | 浏览器自动化(支持 Chrome CDP) |
| vision | 图片分析和理解 |
| delegation | 子 Agent 任务分发——让多个 Agent 并行工作 |
| messaging | 跨平台消息发送 |
| cronjob | 定时任务调度 |
| skills | Skills 浏览和管理 |
Hermes 的 delegate_task 功能让一个「主 Agent」可以分裂出多个「子 Agent」并行工作:
这在处理大型项目时特别高效——不需要把大量中间结果塞进一个上下文窗口,而是各自独立完成、只返回摘要。
| 方案 | 优点 | 缺点 |
|---|---|---|
| 本地(Mac/Linux) | 零延迟、完整终端权限、隐私 | 需要本地运行模型或调用 API |
| 云服务器 | 24/7 在线、URL 可达、可做 Web 服务 | 网络延迟、需配置防火墙 |
| 混合(推荐) | 云端 Hermes + API 模型,微信交互 | API 费用、依赖网络 |
腾讯云 Ubuntu 服务器 + DeepSeek v4-pro API + 微信网关。成本约 ¥200/月(API 调用 + 服务器)。
Hermes 自动记录你的偏好、环境信息、工具使用习惯。跨会话记忆让每次对话都无需从零开始。你可以随时查看和管理这些记忆。
approvals.mode: smart——AI 辅助判断命令风险,高风险操作需确认security.redact_secrets——自动屏蔽工具输出中的 API Key 等敏感信息privacy.redact_pii——网关层脱敏用户个人信息Hermes Agent 不是又一个 ChatBot 套壳。它代表了一种新范式:Agent 不只是工具,而是能学习、能记住、能独立执行任务的数字同事。
如果你在找一个能真正融入工作流的 AI Agent,Hermes 是目前最好的选择。