跳转到主要内容
Home / 前沿动态 / 2026.06.17

Hermes Agent v0.16.0:从终端浮上桌面,开源 Agent 开始学会做减法

2026 年 6 月 5 日,Nous Research 发布 Hermes Agent v0.16.0,代号「The Surface Release」。874 次提交、542 个 PR、1962 个文件改动背后,最大的变化不是新增功能,而是官方开始主动砍掉默认 Skill、压缩上下文成本——这标志着 Hermes 从极客工具向大众产品跨越。

2026 年 6 月 5 日,Nous Research 把 Hermes Agent v0.16.0 定版,次日 GitHub Release 上线。

代号「The Surface Release」——表面发布。名字本身就在说一件事:这个从终端底层长出来的 Agent 框架,终于要浮到「表面」,让普通人也能看见了。

但真正值得关注的不是桌面版本身,而是它背后那条暗线:Hermes 开始做减法了。

一个版本的工程量

从 v0.15.2 到 v0.16.0,只用了一周时间:

指标 数值
提交数 874
合并 PR 542
文件变动 1,962
新增代码 205,216 行
删除代码 46,217 行
关闭 issue 399(含 P0×2 / P1×62 / 安全×16)
贡献者 170 位

170 人一周之内做出一个完整桌面应用,这个效率已经能说明团队的组织密度。但更值得看的是删除的 4.6 万行代码——这说明他们不只是堆功能,而是在清理历史包袱。

桌面版:不是套壳,是完整产品

Hermes Desktop 基于 Electron,支持 Windows、macOS、Linux 三端,安装方式跟普通桌面软件没有区别。

它不是 CLI 的「GUI 皮肤」。桌面版与 CLI、TUI、Web 仪表盘共享同一套配置、Session、Skill、Memory 和 Gateway。你在桌面上开始的会话,CLI 里能接着用;CLI 里配好的 profile,桌面端直接可见。

桌面端核心能力

能力 说明
流式聊天窗口 真正的对话式 UI,不是命令行套壳
会话列表 归档、搜索、跨设备同步
拖拽文件 直接把文件拖进聊天区处理
剪贴板图片粘贴 截图后 Cmd/Ctrl+V 直接提问
Cmd/Ctrl+K 命令面板 全局唤起,类似 VS Code
状态栏模型切换 不用进设置就能换模型
应用内自我更新 不需要手动跑包管理器
完整简体中文 UI、设置、命令中心、cron、skills 全覆盖

默认语言仍是英语,简体中文在 Appearance 设置里切换,选择会持久化到 display.language 字段。底层用了类型化的 i18n 层,后续加语言不会变成硬编码灾难。

远程模式:薄客户端,重后端

桌面应用可以指向一个远程 Hermes Gateway。这意味着:

  • 你的笔记本只跑一个薄薄的 GUI
  • Hermes 核心、API Key、后台任务跑在家庭服务器、工作站或云主机上
  • WebSocket 连接,支持 OAuth 或用户名/密码认证
  • 一个窗口可同时挂载多个 profile,每个 profile 指向不同主机
  • 支持跨 profile 的 @session 链接

这对团队场景很友好:敏感凭据留在服务器,成员本地不留 key。但前提也很明确——远程端必须持续运行,服务器关掉,客户端就断了。

真正的大事:Skill 做减法

桌面版是看得见的变化,但 v0.16 真正的产品转向,是官方开始回答一个问题:默认环境里到底该装多少东西?

被移除的默认 Skill

Skill 原因
spotify 原生 Spotify 插件已提供 7 个工具,重复
linear 改为 hermes mcp install linear
kanban-codex-lane 空白/过时
debugging-hermes-tui-commands 已被新调试工具替代
部分空分类标记 无实际功能

从默认改为可选的 Skill

  • 宝玉文章配图 / 漫画 / 创意构思 / 像素画
  • DSPy
  • 子 Agent 驱动开发
  • Minecraft 服务器
  • Pokémon Player
  • S6 容器管理

这些功能没有消失,只是不再默认加载。需要时一条命令装回来:

hermes skills install 来源/技能名

环境相关性门控

Docker、Kanban、S6 这类上下文相关 Skill,现在只对相关环境露出。写文档的人不会在每个会话里看到容器管理 Skill;不玩 Minecraft 的人也不会被游戏 Skill 打扰。显式请求时仍然会加载。

Curator 开始整理内置 Skill

v0.16 让 Curator 记录每个 Skill 的使用情况,并允许清理长期不用的内置 Skill。但这里有一个明确警告:不要第一天就把列表清空。建议按三个标准判断:

  1. 过去 2-4 周是否实际调用过
  2. 是否只服务某个已结束的项目
  3. 同一能力是否已被插件、MCP 或另一个 Skill 接管

上下文成本:从「能做更多」到「做得更省」

Skill 越多,会话启动时加载的 Skill 索引就越长,模型选择器的噪音也越大。v0.16 在两条线上同时压成本:

1. 默认 Skill 精简

减少默认加载的技能数量,直接缩短系统提示词。新增的诊断命令可以量化这个变化:

hermes prompt-size

升级前后各跑一次,同一个 profile、同一个模型、新会话对比,比凭感觉判断更可靠。

2. 文件读取格式压缩

新的紧凑行号格式,每次读取文件大约减少 14% 的 token。这个优化本身不大,但方向很关键:Hermes 不再只追求功能覆盖,开始处理每一步的上下文成本。

优化项 效果
默认 Skill 精简 缩短系统提示词
紧凑行号格式 每次读文件约省 14% token
hermes prompt-size 可量化诊断
环境门控 无关 Skill 不出现在索引中

Web 仪表盘:从状态页升级为管理后台

hermes dashboard 启动的 Web 界面(默认 http://127.0.0.1:9119)已经变成一个完整管理后台:

页面 功能
Channels 配置 Telegram、Discord、Slack 等消息渠道
管理面板 MCP 目录开关、凭据管理、Webhook/Hooks、记忆配置、Gateway 控制
System 更新前检查、一键 Debug Share

这意味着很多过去需要 SSH 进去改 config.yaml 的操作,现在可以点点点完成。

安全提示:默认绑定 127.0.0.1,只能从本机访问。不要为了手机访问方便就加 --host 0.0.0.0 --insecure,这会把 API Key、渠道配置和会话管理暴露到局域网甚至公网。

其他值得关注的更新

Quick Setup 与 Full Setup

首次启动分成两条路径:

  • Quick Setup:Nous Portal 登录 → 拿到模型选择器 → 直接聊天
  • Full Setup:给高级用户的详细向导

目标很明确:新用户不应该需要看文档就能发出第一条消息。

模糊搜索模型选择器

桌面端、Web、TUI、CLI 统一支持模糊搜索。输入 v4fl 就能调出 deepseek-v4-flash;多端点 provider 合并到一行,目录每小时刷新一次(以前每天)。

本次新增模型:deepseek-v4-flashMiniMax-M3(1M 上下文)、qwen3.7-plusgemini-3.5-flash

/undo [N]

回退最近 N 轮用户输入,预填最后一条消息供编辑重发,中间轮次软删除。CLI、TUI、Telegram、Discord 全平台通用。

但注意/undo 只能撤回对话,不能撤销已经执行的文件修改、命令或外部操作。涉及真实文件时,仍然要靠 Git、Checkpoint 和备份回滚。

NVIDIA/skills 加入可信源

NVIDIA/skills 成为 Skills Hub 的默认可信 tap,与 OpenAI、Anthropic、HuggingFace 同一套流水线。CUDA-X、AIQ、cuOpt 等验证过的技能可以一键安装。

安全修复

16 个安全相关 issue,包括 CVE-2026-48710(Starlette BadHost)、SSRF 检查加固、Bedrock token 隔离等。沙箱后端支持 local、Docker、SSH、Singularity 和 Modal。

产品的真正转向

v0.16.0 之前,Hermes 一直在证明「我能做更多」。v0.16.0 开始,它在回答另一个问题:「默认用户到底需要多少?」

这是两个完全不同的产品哲学:

维度 v0.15 及以前 v0.16.0
默认策略 功能越多越好 克制默认,完整能力可选
用户画像 极客、开发者 极客 + 普通用户
交互入口 CLI/TUI CLI/TUI + Desktop + Web
成本意识 功能优先 上下文成本可量化
安全模型 手动配置 默认本地绑定 + 远程 OAuth

这个转向并不浪漫。一个开源 Agent 框架,默认装得越多,新用户的认知负担就越重,出错的概率也越高。Hermes 选择把「完整能力」和「默认环境」拆开,是走向大众产品的必经之路。

诚实的问题

v0.16.0 并不意味着 Hermes 已经变成一个完美的大众产品。

  • Electron 的体积和内存占用:完整桌面应用不是轻量级方案,老机器可能吃力
  • 远程 Gateway 的运维成本:薄客户端虽然好,但后端需要有人维护
  • Skill 清理的误伤风险:Curator 能删内置 Skill,但缺乏使用数据时容易删错
  • 模糊搜索依赖目录刷新:每小时刷新对大多数场景够用,但模型上线当天仍可能延迟
  • /undo 的边界必须讲清楚:它撤回的是对话,不是副作用

写在最后

Hermes Agent v0.16.0 最有趣的地方在于,它的 headline 是「桌面版来了」,但真正重要的变化是「默认环境变轻了」。

桌面版让非技术用户能触达 Hermes;Skill 精简和上下文成本优化,让这些非技术用户不会被复杂的能力列表淹死。前者是入口,后者是体验。

当一个开源 Agent 框架开始主动做减法,通常意味着它准备从「极客玩具」变成「真正有人用的产品」了。