文章目录
- 三条完全不同的路
- 先看底牌
- 核心能力逐项拆解
- 桌面控制:Codex的杀手锏
- 自进化学习:Hermes的护城河
- 生态协同:WorkBuddy的主场
- 模型与定价:差距最大的地方
- 架构哲学:为什么它们走出了三条路
- Codex:超级应用哲学
- Hermes:自举进化哲学
- WorkBuddy:生态嵌入哲学
- 到底谁适合你?
- 你是全职开发者,需要桌面级编码体验
- 你在乎隐私,数据不能出本机
- 你在中国,需要办公自动化
- 你是"一人公司"创业者
- 你是AI研究者,需要训练和微调
- 几句大实话
2026年春节一过,AI Agent像火山一样喷了。OpenAI的Codex从终端工具变成桌面超级App,Nous Research的Hermes靠自进化三个月刷到15万星,腾讯CodeBuddy团队搞出的WorkBuddy直接拿了个国内DAU第一。三款产品,两个国家,三种Agent打法——桌面控制、自进化学习、生态协同。今天不聊谁好谁坏,聊聊它们到底在拼什么。
三条完全不同的路
先说结论:这三款产品走的是三条根本不一样的路。
- Codex桌面版:从"帮你写代码"变成"帮你操作电脑"——桌面控制路线
- Hermes Agent:从"听你指挥"变成"越用越懂你"——自进化学习路线
- WorkBuddy:从"编程助手"变成"全公司都用的AI员工"——生态协同路线
这不是简单的功能差异。说深了是底层哲学的差异——Codex觉得Agent应该像你的双手,替你操作一切;Hermes觉得Agent应该像你的记忆,越来越懂你;WorkBuddy觉得Agent应该像你的团队,调用整个公司的能力帮你干活。
先看底牌
| 维度 | Codex 桌面版 | Hermes Agent | WorkBuddy (CodeBuddy系) |
|---|---|---|---|
| 开发方 | OpenAI | Nous Research | 腾讯云 CodeBuddy 团队 |
| 定位 | 开发者桌面超级App | 自进化持久智能体 | 全场景AI办公智能体 |
| 发布时间 | 2026年2月(macOS) | 2026年2月25日 | 2026年3月(公测) |
| 开源 | CLI部分 Apache-2.0 | MIT | 闭源 |
| 产品形态 | 桌面App + CLI + IDE插件 + 云端 | CLI + 多平台消息网关 | 桌面App + 小程序 + 微信直连 |
| 核心模型 | GPT-5.4 / GPT-5.3-Codex | 200+模型(OpenRouter) | 混元 + DeepSeek + Hy3 |
| GitHub Stars | 74K+ | 157K+ | — |
| 周活用户 | 300万+ | — | DAU国内第一 |
你看,基因就完全不一样。Codex是OpenAI生态的延伸,Hermes是开源社区的旗帜,WorkBuddy是腾讯生态的触角。
核心能力逐项拆解
桌面控制:Codex的杀手锏
2026年4月16日,OpenAI放了个大招——Codex能"看见"你的电脑屏幕了,移动光标、点击按钮、输入文字,跟你自己操作一样。Figma、Xcode、Slack、浏览器……全都能搞定。
而且不是只能一个一个来。多个Agent可以同时在不同窗口干活,你继续用你的电脑,它们在后台跑着。这个能力叫"Background Computer Use",说实话挺震撼的。但有个坑——目前仅限macOS,EU/UK还没开放。
另外两款在这块走的是完全不同的路:
- Hermes有浏览器自动化和视觉分析,但更偏"在终端里帮你浏览"的意思,不是直接操控桌面GUI
- WorkBuddy更绝——它不操控你的桌面,而是直接住进腾讯文档、企业微信这些应用里面。不需要看你的屏幕,因为它已经在应用里面了
三种路线各有取舍:Codex操控最直接但需要macOS权限,Hermes自动化强但只在终端/浏览器里,WorkBuddy最省事但只限腾讯生态。
自进化学习:Hermes的护城河
Hermes最狠的地方是它的学习闭环——用得越久越懂你。不是客套话,是真的会越来越聪明。
这套系统叫GEPA(Genetic-Pareto Prompt Evolution),ICLR 2026 Oral论文,学术级别的东西。说白了就是:Hermes解决一个问题后,会自动把解决方法写成Skill文档存下来,下次遇到类似问题直接调用。不是简单的"记住你上次说了什么"那种,而是真正的知识积累——四层渐进式记忆架构,从短期上下文到项目级知识到通用技能,层层递进。
嗯……这有点像什么呢,像一个程序员把踩过的坑都记在笔记里,而且永远不会忘。
Codex在4月更新里也加了Memory预览功能——能记住你的偏好、修正过的错误、上次的项目上下文。老实说,目前还只是Enterprise和Edu用户能用,Plus/Pro还在排队。而且更偏"记住偏好"而非"自主学习",跟Hermes那种"AI自己学"的模式还有差距。
WorkBuddy这边有个"专家团"系统——24个专家团、160位AI角色,用户可以自己创建"专家分身"。比如一个内容创作者把自己做短视频的方法论封装成分身,别人可以直接调用。但这是"人教AI"的模式,跟Hermes的"AI自己学"不一样。
生态协同:WorkBuddy的主场
说到生态,WorkBuddy是真的有东西。
背后是腾讯整张网——企业微信、腾讯文档、QQ邮箱、微云、腾讯会议……WorkBuddy不是站在这些产品外面调它们的接口,而是直接住了进去。你在腾讯文档里说一句话,WorkBuddy直接在文档里完成修改,不用下载、上传、切换应用。怎么讲呢,这个体验是真的很丝滑。
更绝的是微信直连——小程序版上线后,你可以从电脑让专家团开始干活,出门了打开微信小程序说一句话,回家电脑上材料已经改好。他们内部管这个叫"流动的上下文"。
马化腾在一季度财报会上直接点名:"效率智能体解决方案已初见成效,WorkBuddy目前是中国使用最广的效率智能体服务。"第三方数据显示月访问量885万,领先第二名2.6倍。
反观Codex和Hermes:
- Codex的生态是插件体系——4月更新一次上了90+插件,GitHub、Slack、Notion、Figma、Linear都有。走的是"策展式"路线,每个插件都经过安全审核,跟OpenClaw那种3千多个未审核的MCP完全不同。说实话这个策略更聪明,90个可信的比3千个未知的强
- Hermes的生态是消息平台——Telegram、Discord、Slack、WhatsApp、Signal,你能想到的通讯工具它都接了。但更像是"多入口"而非"深度嵌入"
三种生态策略:Codex是插件商店、Hermes是多平台网关、WorkBuddy是原生居住。
模型与定价:差距最大的地方
| 维度 | Codex 桌面版 | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 默认模型 | GPT-5.4 / GPT-5.3-Codex | 自选(200+) | 混元 / DeepSeek / Hy3 |
| 模型自由度 | 仅OpenAI | 200+模型可选 | 5大模型切换 |
| 本地部署 | ❌ | ✅(vLLM完全本地) | ❌ |
| 免费额度 | ChatGPT Free有限体验 | 完全免费开源 | 新用户5000 Credits |
| 付费方案 | Plus $20/月,Pro $200/月 | 模型API费用 | 约800元/月订阅 |
模型这块差异真挺大的。Hermes通过OpenRouter接200+模型,还支持vLLM完全本地运行——隐私敏感的场景,基本只有它一个选择。Codex绑死在OpenAI模型上,没得选但不用选。WorkBuddy接了混元、DeepSeek、Hy3等5大模型,接入Hy3 preview后首响速度提升54%,端到端任务时长缩短47%,这个进步确实不小。
架构哲学:为什么它们走出了三条路
Codex:超级应用哲学
桌面App → 多Agent并行 → Computer Use操控全电脑 → Skills扩展 → 90+插件 → Memory → 持久偏好记忆Codex的核心假设是:Agent应该像操作系统一样,操控你电脑上的一切。从终端编码到GUI操控到图片生成到定时任务,一个App全搞定。这很苹果——封闭但体验一致。
Hermes:自举进化哲学
消息网关 → 核心引擎 → GEPA自进化 → 持久记忆 → 技能自动积累 → 子智能体 → 并行委托 → 执行环境 → 本地/Docker/SSH/ModalHermes的核心假设是:Agent应该像生命体一样,越用越聪明。它不追求大而全的功能覆盖,追求的是"用三个月后它比任何新工具都懂你"。这很开源——开放但需要耐心。
WorkBuddy:生态嵌入哲学
CodeBuddy Agent SDK → WorkBuddy桌面端 → 微信/企微/QQ直连 → 腾讯文档/会议/邮箱 原生居住 → 专家团/分身 → 160+AI角色 → CloudAgent → Harness云端托管 → SkillHub → AI技能社区WorkBuddy的核心假设是:Agent的竞争力不在于自身多强,而在于身后那张能被它调用的网有多密。它不操控你的电脑,它直接住在你的工作环境里。这很腾讯——生态强但绑定感也强。
腾讯云智能体产品负责人黄广民有个公式我挺认同的:Agent = 模型 × 上下文 × 循环。模型决定上限,上下文和循环决定能不能稳定逼近上限。大多数人不会撞到模型的上限,大多数人栽在上下文和循环上。
到底谁适合你?
你是全职开发者,需要桌面级编码体验
👉Codex 桌面版
300万周活不是吹的。Computer Use帮你操控Figma和浏览器,多Agent并行跑任务,PR review直接在App里完成,SSH连远程开发机——整个开发流程一条龙。已经在ChatGPT生态里的,Plus $20/月就够日常用了。
你在乎隐私,数据不能出本机
👉Hermes Agent
这个真没得选。MIT开源可审计,vLLM完全本地运行,数据全存在本地,零追踪零遥测。而且用三个月后它比任何工具都懂你的项目风格和偏好。金融、医疗、国防场景,别犹豫。
你在中国,需要办公自动化
👉WorkBuddy
微信直连、腾讯文档原生、小程序追任务——光这三条就足够了。24个专家团覆盖从写方案到做PPT到数据分析,非技术人员10分钟上手。月访问885万、DAU国内第一,数据已经说明问题了。
你是"一人公司"创业者
👉WorkBuddy
一个人开公司最怕的不是没想法,是琐碎。WorkBuddy上有用户搭了6个AI员工岗位——内容策划、销售转化、设计交付、数据分析、客户服务、项目管理——传统6人团队月成本5到8万,他每月800块订阅费就跑起来了。这个性价比真的没话说。
你是AI研究者,需要训练和微调
👉Hermes Agent
内置Atropos框架,GEPA算法,轨迹导出,强化学习训练。这是唯一把"智能体训练"作为一等公民来支持的工具。157K+ GitHub Stars说明研究社区认它。
几句大实话
| 维度 | Codex 桌面版 | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 一句话 | 操控电脑的超级App | 越用越聪明的自进化智能体 | 住在微信里的AI员工 |
| 核心优势 | Computer Use、多Agent并行、OpenAI生态 | 自进化学习、隐私优先、模型自由 | 微信直连、腾讯生态、开箱即用 |
| 核心劣势 | 仅macOS Computer Use、绑死OpenAI | 生态年轻、非开发者门槛高 | 闭源、非腾讯生态绑定感强 |
| 适用人群 | OpenAI生态开发者 | 隐私敏感/研究者 | 中国职场人/一人公司 |
讲道理,没有最好的工具,只有最合适的场景。Codex拼操控,Hermes拼进化,WorkBuddy拼生态——选哪个取决于你最看重什么。
本文基于2026年5月的公开信息写的,产品迭代飞快,建议以官方最新文档为准。有啥问题评论区聊聊,我都在。