2026 年 6 月 5 日,Nous Research 把 Hermes Agent v0.16.0 定版,次日 GitHub Release 上线。
代号「The Surface Release」——表面发布。名字本身就在说一件事:这个从终端底层长出来的 Agent 框架,终于要浮到「表面」,让普通人也能看见了。
但真正值得关注的不是桌面版本身,而是它背后那条暗线:Hermes 开始做减法了。
一个版本的工程量
从 v0.15.2 到 v0.16.0,只用了一周时间:
| 指标 | 数值 |
|---|---|
| 提交数 | 874 |
| 合并 PR | 542 |
| 文件变动 | 1,962 |
| 新增代码 | 205,216 行 |
| 删除代码 | 46,217 行 |
| 关闭 issue | 399(含 P0×2 / P1×62 / 安全×16) |
| 贡献者 | 170 位 |
170 人一周之内做出一个完整桌面应用,这个效率已经能说明团队的组织密度。但更值得看的是删除的 4.6 万行代码——这说明他们不只是堆功能,而是在清理历史包袱。
桌面版:不是套壳,是完整产品
Hermes Desktop 基于 Electron,支持 Windows、macOS、Linux 三端,安装方式跟普通桌面软件没有区别。
它不是 CLI 的「GUI 皮肤」。桌面版与 CLI、TUI、Web 仪表盘共享同一套配置、Session、Skill、Memory 和 Gateway。你在桌面上开始的会话,CLI 里能接着用;CLI 里配好的 profile,桌面端直接可见。
桌面端核心能力
| 能力 | 说明 |
|---|---|
| 流式聊天窗口 | 真正的对话式 UI,不是命令行套壳 |
| 会话列表 | 归档、搜索、跨设备同步 |
| 拖拽文件 | 直接把文件拖进聊天区处理 |
| 剪贴板图片粘贴 | 截图后 Cmd/Ctrl+V 直接提问 |
Cmd/Ctrl+K 命令面板 |
全局唤起,类似 VS Code |
| 状态栏模型切换 | 不用进设置就能换模型 |
| 应用内自我更新 | 不需要手动跑包管理器 |
| 完整简体中文 | UI、设置、命令中心、cron、skills 全覆盖 |
默认语言仍是英语,简体中文在 Appearance 设置里切换,选择会持久化到 display.language 字段。底层用了类型化的 i18n 层,后续加语言不会变成硬编码灾难。
远程模式:薄客户端,重后端
桌面应用可以指向一个远程 Hermes Gateway。这意味着:
- 你的笔记本只跑一个薄薄的 GUI
- Hermes 核心、API Key、后台任务跑在家庭服务器、工作站或云主机上
- WebSocket 连接,支持 OAuth 或用户名/密码认证
- 一个窗口可同时挂载多个 profile,每个 profile 指向不同主机
- 支持跨 profile 的
@session链接
这对团队场景很友好:敏感凭据留在服务器,成员本地不留 key。但前提也很明确——远程端必须持续运行,服务器关掉,客户端就断了。
真正的大事:Skill 做减法
桌面版是看得见的变化,但 v0.16 真正的产品转向,是官方开始回答一个问题:默认环境里到底该装多少东西?
被移除的默认 Skill
| Skill | 原因 |
|---|---|
spotify |
原生 Spotify 插件已提供 7 个工具,重复 |
linear |
改为 hermes mcp install linear |
kanban-codex-lane |
空白/过时 |
debugging-hermes-tui-commands |
已被新调试工具替代 |
| 部分空分类标记 | 无实际功能 |
从默认改为可选的 Skill
- 宝玉文章配图 / 漫画 / 创意构思 / 像素画
- DSPy
- 子 Agent 驱动开发
- Minecraft 服务器
- Pokémon Player
- S6 容器管理
这些功能没有消失,只是不再默认加载。需要时一条命令装回来:
hermes skills install 来源/技能名
环境相关性门控
Docker、Kanban、S6 这类上下文相关 Skill,现在只对相关环境露出。写文档的人不会在每个会话里看到容器管理 Skill;不玩 Minecraft 的人也不会被游戏 Skill 打扰。显式请求时仍然会加载。
Curator 开始整理内置 Skill
v0.16 让 Curator 记录每个 Skill 的使用情况,并允许清理长期不用的内置 Skill。但这里有一个明确警告:不要第一天就把列表清空。建议按三个标准判断:
- 过去 2-4 周是否实际调用过
- 是否只服务某个已结束的项目
- 同一能力是否已被插件、MCP 或另一个 Skill 接管
上下文成本:从「能做更多」到「做得更省」
Skill 越多,会话启动时加载的 Skill 索引就越长,模型选择器的噪音也越大。v0.16 在两条线上同时压成本:
1. 默认 Skill 精简
减少默认加载的技能数量,直接缩短系统提示词。新增的诊断命令可以量化这个变化:
hermes prompt-size
升级前后各跑一次,同一个 profile、同一个模型、新会话对比,比凭感觉判断更可靠。
2. 文件读取格式压缩
新的紧凑行号格式,每次读取文件大约减少 14% 的 token。这个优化本身不大,但方向很关键:Hermes 不再只追求功能覆盖,开始处理每一步的上下文成本。
| 优化项 | 效果 |
|---|---|
| 默认 Skill 精简 | 缩短系统提示词 |
| 紧凑行号格式 | 每次读文件约省 14% token |
hermes prompt-size |
可量化诊断 |
| 环境门控 | 无关 Skill 不出现在索引中 |
Web 仪表盘:从状态页升级为管理后台
hermes dashboard 启动的 Web 界面(默认 http://127.0.0.1:9119)已经变成一个完整管理后台:
| 页面 | 功能 |
|---|---|
| Channels | 配置 Telegram、Discord、Slack 等消息渠道 |
| 管理面板 | MCP 目录开关、凭据管理、Webhook/Hooks、记忆配置、Gateway 控制 |
| System | 更新前检查、一键 Debug Share |
这意味着很多过去需要 SSH 进去改 config.yaml 的操作,现在可以点点点完成。
安全提示:默认绑定 127.0.0.1,只能从本机访问。不要为了手机访问方便就加 --host 0.0.0.0 --insecure,这会把 API Key、渠道配置和会话管理暴露到局域网甚至公网。
其他值得关注的更新
Quick Setup 与 Full Setup
首次启动分成两条路径:
- Quick Setup:Nous Portal 登录 → 拿到模型选择器 → 直接聊天
- Full Setup:给高级用户的详细向导
目标很明确:新用户不应该需要看文档就能发出第一条消息。
模糊搜索模型选择器
桌面端、Web、TUI、CLI 统一支持模糊搜索。输入 v4fl 就能调出 deepseek-v4-flash;多端点 provider 合并到一行,目录每小时刷新一次(以前每天)。
本次新增模型:deepseek-v4-flash、MiniMax-M3(1M 上下文)、qwen3.7-plus、gemini-3.5-flash。
/undo [N]
回退最近 N 轮用户输入,预填最后一条消息供编辑重发,中间轮次软删除。CLI、TUI、Telegram、Discord 全平台通用。
但注意:/undo 只能撤回对话,不能撤销已经执行的文件修改、命令或外部操作。涉及真实文件时,仍然要靠 Git、Checkpoint 和备份回滚。
NVIDIA/skills 加入可信源
NVIDIA/skills 成为 Skills Hub 的默认可信 tap,与 OpenAI、Anthropic、HuggingFace 同一套流水线。CUDA-X、AIQ、cuOpt 等验证过的技能可以一键安装。
安全修复
16 个安全相关 issue,包括 CVE-2026-48710(Starlette BadHost)、SSRF 检查加固、Bedrock token 隔离等。沙箱后端支持 local、Docker、SSH、Singularity 和 Modal。
产品的真正转向
v0.16.0 之前,Hermes 一直在证明「我能做更多」。v0.16.0 开始,它在回答另一个问题:「默认用户到底需要多少?」
这是两个完全不同的产品哲学:
| 维度 | v0.15 及以前 | v0.16.0 |
|---|---|---|
| 默认策略 | 功能越多越好 | 克制默认,完整能力可选 |
| 用户画像 | 极客、开发者 | 极客 + 普通用户 |
| 交互入口 | CLI/TUI | CLI/TUI + Desktop + Web |
| 成本意识 | 功能优先 | 上下文成本可量化 |
| 安全模型 | 手动配置 | 默认本地绑定 + 远程 OAuth |
这个转向并不浪漫。一个开源 Agent 框架,默认装得越多,新用户的认知负担就越重,出错的概率也越高。Hermes 选择把「完整能力」和「默认环境」拆开,是走向大众产品的必经之路。
诚实的问题
v0.16.0 并不意味着 Hermes 已经变成一个完美的大众产品。
- Electron 的体积和内存占用:完整桌面应用不是轻量级方案,老机器可能吃力
- 远程 Gateway 的运维成本:薄客户端虽然好,但后端需要有人维护
- Skill 清理的误伤风险:Curator 能删内置 Skill,但缺乏使用数据时容易删错
- 模糊搜索依赖目录刷新:每小时刷新对大多数场景够用,但模型上线当天仍可能延迟
/undo的边界必须讲清楚:它撤回的是对话,不是副作用
写在最后
Hermes Agent v0.16.0 最有趣的地方在于,它的 headline 是「桌面版来了」,但真正重要的变化是「默认环境变轻了」。
桌面版让非技术用户能触达 Hermes;Skill 精简和上下文成本优化,让这些非技术用户不会被复杂的能力列表淹死。前者是入口,后者是体验。
当一个开源 Agent 框架开始主动做减法,通常意味着它准备从「极客玩具」变成「真正有人用的产品」了。