2026年三大AI桌面智能体横评：Codex vs Hermes vs WorkBuddy-港品优选

文章目录

- 三条完全不同的路
- 先看底牌
- 核心能力逐项拆解
- - 桌面控制：Codex的杀手锏
  - 自进化学习：Hermes的护城河
  - 生态协同：WorkBuddy的主场
  - 模型与定价：差距最大的地方
- 架构哲学：为什么它们走出了三条路
- - Codex：超级应用哲学
  - Hermes：自举进化哲学
  - WorkBuddy：生态嵌入哲学
- 到底谁适合你？
- - 你是全职开发者，需要桌面级编码体验
  - 你在乎隐私，数据不能出本机
  - 你在中国，需要办公自动化
  - 你是"一人公司"创业者
  - 你是AI研究者，需要训练和微调
- 几句大实话

2026年春节一过，AI Agent像火山一样喷了。OpenAI的Codex从终端工具变成桌面超级App，Nous Research的Hermes靠自进化三个月刷到15万星，腾讯CodeBuddy团队搞出的WorkBuddy直接拿了个国内DAU第一。三款产品，两个国家，三种Agent打法——桌面控制、自进化学习、生态协同。今天不聊谁好谁坏，聊聊它们到底在拼什么。

三条完全不同的路

先说结论：这三款产品走的是三条根本不一样的路。

Codex桌面版：从"帮你写代码"变成"帮你操作电脑"——桌面控制路线
Hermes Agent：从"听你指挥"变成"越用越懂你"——自进化学习路线
WorkBuddy：从"编程助手"变成"全公司都用的AI员工"——生态协同路线

这不是简单的功能差异。说深了是底层哲学的差异——Codex觉得Agent应该像你的双手，替你操作一切；Hermes觉得Agent应该像你的记忆，越来越懂你；WorkBuddy觉得Agent应该像你的团队，调用整个公司的能力帮你干活。

先看底牌

维度	Codex 桌面版	Hermes Agent	WorkBuddy (CodeBuddy系)
开发方	OpenAI	Nous Research	腾讯云 CodeBuddy 团队
定位	开发者桌面超级App	自进化持久智能体	全场景AI办公智能体
发布时间	2026年2月（macOS）	2026年2月25日	2026年3月（公测）
开源	CLI部分 Apache-2.0	MIT	闭源
产品形态	桌面App + CLI + IDE插件 + 云端	CLI + 多平台消息网关	桌面App + 小程序 + 微信直连
核心模型	GPT-5.4 / GPT-5.3-Codex	200+模型（OpenRouter）	混元 + DeepSeek + Hy3
GitHub Stars	74K+	157K+	—
周活用户	300万+	—	DAU国内第一

你看，基因就完全不一样。Codex是OpenAI生态的延伸，Hermes是开源社区的旗帜，WorkBuddy是腾讯生态的触角。

核心能力逐项拆解

桌面控制：Codex的杀手锏

2026年4月16日，OpenAI放了个大招——Codex能"看见"你的电脑屏幕了，移动光标、点击按钮、输入文字，跟你自己操作一样。Figma、Xcode、Slack、浏览器……全都能搞定。

而且不是只能一个一个来。多个Agent可以同时在不同窗口干活，你继续用你的电脑，它们在后台跑着。这个能力叫"Background Computer Use"，说实话挺震撼的。但有个坑——目前仅限macOS，EU/UK还没开放。

另外两款在这块走的是完全不同的路：

Hermes有浏览器自动化和视觉分析，但更偏"在终端里帮你浏览"的意思，不是直接操控桌面GUI
WorkBuddy更绝——它不操控你的桌面，而是直接住进腾讯文档、企业微信这些应用里面。不需要看你的屏幕，因为它已经在应用里面了

三种路线各有取舍：Codex操控最直接但需要macOS权限，Hermes自动化强但只在终端/浏览器里，WorkBuddy最省事但只限腾讯生态。

自进化学习：Hermes的护城河

Hermes最狠的地方是它的学习闭环——用得越久越懂你。不是客套话，是真的会越来越聪明。

这套系统叫GEPA（Genetic-Pareto Prompt Evolution），ICLR 2026 Oral论文，学术级别的东西。说白了就是：Hermes解决一个问题后，会自动把解决方法写成Skill文档存下来，下次遇到类似问题直接调用。不是简单的"记住你上次说了什么"那种，而是真正的知识积累——四层渐进式记忆架构，从短期上下文到项目级知识到通用技能，层层递进。

嗯……这有点像什么呢，像一个程序员把踩过的坑都记在笔记里，而且永远不会忘。

Codex在4月更新里也加了Memory预览功能——能记住你的偏好、修正过的错误、上次的项目上下文。老实说，目前还只是Enterprise和Edu用户能用，Plus/Pro还在排队。而且更偏"记住偏好"而非"自主学习"，跟Hermes那种"AI自己学"的模式还有差距。

WorkBuddy这边有个"专家团"系统——24个专家团、160位AI角色，用户可以自己创建"专家分身"。比如一个内容创作者把自己做短视频的方法论封装成分身，别人可以直接调用。但这是"人教AI"的模式，跟Hermes的"AI自己学"不一样。

生态协同：WorkBuddy的主场

说到生态，WorkBuddy是真的有东西。

背后是腾讯整张网——企业微信、腾讯文档、QQ邮箱、微云、腾讯会议……WorkBuddy不是站在这些产品外面调它们的接口，而是直接住了进去。你在腾讯文档里说一句话，WorkBuddy直接在文档里完成修改，不用下载、上传、切换应用。怎么讲呢，这个体验是真的很丝滑。

更绝的是微信直连——小程序版上线后，你可以从电脑让专家团开始干活，出门了打开微信小程序说一句话，回家电脑上材料已经改好。他们内部管这个叫"流动的上下文"。

马化腾在一季度财报会上直接点名："效率智能体解决方案已初见成效，WorkBuddy目前是中国使用最广的效率智能体服务。"第三方数据显示月访问量885万，领先第二名2.6倍。

反观Codex和Hermes：

Codex的生态是插件体系——4月更新一次上了90+插件，GitHub、Slack、Notion、Figma、Linear都有。走的是"策展式"路线，每个插件都经过安全审核，跟OpenClaw那种3千多个未审核的MCP完全不同。说实话这个策略更聪明，90个可信的比3千个未知的强
Hermes的生态是消息平台——Telegram、Discord、Slack、WhatsApp、Signal，你能想到的通讯工具它都接了。但更像是"多入口"而非"深度嵌入"

三种生态策略：Codex是插件商店、Hermes是多平台网关、WorkBuddy是原生居住。

模型与定价：差距最大的地方

维度	Codex 桌面版	Hermes Agent	WorkBuddy
默认模型	GPT-5.4 / GPT-5.3-Codex	自选（200+）	混元 / DeepSeek / Hy3
模型自由度	仅OpenAI	200+模型可选	5大模型切换
本地部署	❌	✅（vLLM完全本地）	❌
免费额度	ChatGPT Free有限体验	完全免费开源	新用户5000 Credits
付费方案	Plus $20/月，Pro $200/月	模型API费用	约800元/月订阅

模型这块差异真挺大的。Hermes通过OpenRouter接200+模型，还支持vLLM完全本地运行——隐私敏感的场景，基本只有它一个选择。Codex绑死在OpenAI模型上，没得选但不用选。WorkBuddy接了混元、DeepSeek、Hy3等5大模型，接入Hy3 preview后首响速度提升54%，端到端任务时长缩短47%，这个进步确实不小。

架构哲学：为什么它们走出了三条路

Codex：超级应用哲学

桌面App → 多Agent并行 → Computer Use操控全电脑 → Skills扩展 → 90+插件 → Memory → 持久偏好记忆

Codex的核心假设是：Agent应该像操作系统一样，操控你电脑上的一切。从终端编码到GUI操控到图片生成到定时任务，一个App全搞定。这很苹果——封闭但体验一致。

Hermes：自举进化哲学

消息网关 → 核心引擎 → GEPA自进化 → 持久记忆 → 技能自动积累 → 子智能体 → 并行委托 → 执行环境 → 本地/Docker/SSH/Modal

Hermes的核心假设是：Agent应该像生命体一样，越用越聪明。它不追求大而全的功能覆盖，追求的是"用三个月后它比任何新工具都懂你"。这很开源——开放但需要耐心。

WorkBuddy：生态嵌入哲学

CodeBuddy Agent SDK → WorkBuddy桌面端 → 微信/企微/QQ直连 → 腾讯文档/会议/邮箱 原生居住 → 专家团/分身 → 160+AI角色 → CloudAgent → Harness云端托管 → SkillHub → AI技能社区

WorkBuddy的核心假设是：Agent的竞争力不在于自身多强，而在于身后那张能被它调用的网有多密。它不操控你的电脑，它直接住在你的工作环境里。这很腾讯——生态强但绑定感也强。

腾讯云智能体产品负责人黄广民有个公式我挺认同的：Agent = 模型 × 上下文 × 循环。模型决定上限，上下文和循环决定能不能稳定逼近上限。大多数人不会撞到模型的上限，大多数人栽在上下文和循环上。

到底谁适合你？

你是全职开发者，需要桌面级编码体验

👉Codex 桌面版

300万周活不是吹的。Computer Use帮你操控Figma和浏览器，多Agent并行跑任务，PR review直接在App里完成，SSH连远程开发机——整个开发流程一条龙。已经在ChatGPT生态里的，Plus $20/月就够日常用了。

你在乎隐私，数据不能出本机

👉Hermes Agent

这个真没得选。MIT开源可审计，vLLM完全本地运行，数据全存在本地，零追踪零遥测。而且用三个月后它比任何工具都懂你的项目风格和偏好。金融、医疗、国防场景，别犹豫。

你在中国，需要办公自动化

👉WorkBuddy

微信直连、腾讯文档原生、小程序追任务——光这三条就足够了。24个专家团覆盖从写方案到做PPT到数据分析，非技术人员10分钟上手。月访问885万、DAU国内第一，数据已经说明问题了。

你是"一人公司"创业者

👉WorkBuddy

一个人开公司最怕的不是没想法，是琐碎。WorkBuddy上有用户搭了6个AI员工岗位——内容策划、销售转化、设计交付、数据分析、客户服务、项目管理——传统6人团队月成本5到8万，他每月800块订阅费就跑起来了。这个性价比真的没话说。

你是AI研究者，需要训练和微调

👉Hermes Agent

内置Atropos框架，GEPA算法，轨迹导出，强化学习训练。这是唯一把"智能体训练"作为一等公民来支持的工具。157K+ GitHub Stars说明研究社区认它。

几句大实话

维度	Codex 桌面版	Hermes Agent	WorkBuddy
一句话	操控电脑的超级App	越用越聪明的自进化智能体	住在微信里的AI员工
核心优势	Computer Use、多Agent并行、OpenAI生态	自进化学习、隐私优先、模型自由	微信直连、腾讯生态、开箱即用
核心劣势	仅macOS Computer Use、绑死OpenAI	生态年轻、非开发者门槛高	闭源、非腾讯生态绑定感强
适用人群	OpenAI生态开发者	隐私敏感/研究者	中国职场人/一人公司

讲道理，没有最好的工具，只有最合适的场景。Codex拼操控，Hermes拼进化，WorkBuddy拼生态——选哪个取决于你最看重什么。

本文基于2026年5月的公开信息写的，产品迭代飞快，建议以官方最新文档为准。有啥问题评论区聊聊，我都在。

企业官网建设流程全解析

文章目录

三条完全不同的路

先看底牌

核心能力逐项拆解

桌面控制：Codex的杀手锏

自进化学习：Hermes的护城河

生态协同：WorkBuddy的主场

模型与定价：差距最大的地方

架构哲学：为什么它们走出了三条路

Codex：超级应用哲学

Hermes：自举进化哲学

WorkBuddy：生态嵌入哲学

到底谁适合你？

你是全职开发者，需要桌面级编码体验

你在乎隐私，数据不能出本机

你在中国，需要办公自动化

你是"一人公司"创业者

你是AI研究者，需要训练和微调

几句大实话

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

文章目录

三条完全不同的路

先看底牌

核心能力逐项拆解

桌面控制：Codex的杀手锏

自进化学习：Hermes的护城河

生态协同：WorkBuddy的主场

模型与定价：差距最大的地方

架构哲学：为什么它们走出了三条路

Codex：超级应用哲学

Hermes：自举进化哲学

WorkBuddy：生态嵌入哲学

到底谁适合你？

你是全职开发者，需要桌面级编码体验

你在乎隐私，数据不能出本机

你在中国，需要办公自动化

你是"一人公司"创业者

你是AI研究者，需要训练和微调

几句大实话

热门文章

文章分类

标签云

相关文章

电脑里的“大脑”和“画家”：CPU和GPU到底谁在偷偷帮你干活？

3个实用方法彻底解决阅读APP书源失效问题

QMCDecode：Mac用户专属的QQ音乐加密文件终极解密方案

需要专业的网站建设服务？