2026年三大AI桌面智能体横评:Codex vs Hermes vs WorkBuddy
2026/5/23 23:33:46 网站建设 项目流程

文章目录

    • 三条完全不同的路
    • 先看底牌
    • 核心能力逐项拆解
      • 桌面控制:Codex的杀手锏
      • 自进化学习:Hermes的护城河
      • 生态协同:WorkBuddy的主场
      • 模型与定价:差距最大的地方
    • 架构哲学:为什么它们走出了三条路
      • Codex:超级应用哲学
      • Hermes:自举进化哲学
      • WorkBuddy:生态嵌入哲学
    • 到底谁适合你?
      • 你是全职开发者,需要桌面级编码体验
      • 你在乎隐私,数据不能出本机
      • 你在中国,需要办公自动化
      • 你是"一人公司"创业者
      • 你是AI研究者,需要训练和微调
    • 几句大实话

2026年春节一过,AI Agent像火山一样喷了。OpenAI的Codex从终端工具变成桌面超级App,Nous Research的Hermes靠自进化三个月刷到15万星,腾讯CodeBuddy团队搞出的WorkBuddy直接拿了个国内DAU第一。三款产品,两个国家,三种Agent打法——桌面控制、自进化学习、生态协同。今天不聊谁好谁坏,聊聊它们到底在拼什么。

三条完全不同的路

先说结论:这三款产品走的是三条根本不一样的路。

  • Codex桌面版:从"帮你写代码"变成"帮你操作电脑"——桌面控制路线
  • Hermes Agent:从"听你指挥"变成"越用越懂你"——自进化学习路线
  • WorkBuddy:从"编程助手"变成"全公司都用的AI员工"——生态协同路线

这不是简单的功能差异。说深了是底层哲学的差异——Codex觉得Agent应该像你的双手,替你操作一切;Hermes觉得Agent应该像你的记忆,越来越懂你;WorkBuddy觉得Agent应该像你的团队,调用整个公司的能力帮你干活。

先看底牌

维度Codex 桌面版Hermes AgentWorkBuddy (CodeBuddy系)
开发方OpenAINous Research腾讯云 CodeBuddy 团队
定位开发者桌面超级App自进化持久智能体全场景AI办公智能体
发布时间2026年2月(macOS)2026年2月25日2026年3月(公测)
开源CLI部分 Apache-2.0MIT闭源
产品形态桌面App + CLI + IDE插件 + 云端CLI + 多平台消息网关桌面App + 小程序 + 微信直连
核心模型GPT-5.4 / GPT-5.3-Codex200+模型(OpenRouter)混元 + DeepSeek + Hy3
GitHub Stars74K+157K+
周活用户300万+DAU国内第一

你看,基因就完全不一样。Codex是OpenAI生态的延伸,Hermes是开源社区的旗帜,WorkBuddy是腾讯生态的触角。

核心能力逐项拆解

桌面控制:Codex的杀手锏

2026年4月16日,OpenAI放了个大招——Codex能"看见"你的电脑屏幕了,移动光标、点击按钮、输入文字,跟你自己操作一样。Figma、Xcode、Slack、浏览器……全都能搞定。

而且不是只能一个一个来。多个Agent可以同时在不同窗口干活,你继续用你的电脑,它们在后台跑着。这个能力叫"Background Computer Use",说实话挺震撼的。但有个坑——目前仅限macOS,EU/UK还没开放。

另外两款在这块走的是完全不同的路:

  • Hermes有浏览器自动化和视觉分析,但更偏"在终端里帮你浏览"的意思,不是直接操控桌面GUI
  • WorkBuddy更绝——它不操控你的桌面,而是直接住进腾讯文档、企业微信这些应用里面。不需要看你的屏幕,因为它已经在应用里面了

三种路线各有取舍:Codex操控最直接但需要macOS权限,Hermes自动化强但只在终端/浏览器里,WorkBuddy最省事但只限腾讯生态。

自进化学习:Hermes的护城河

Hermes最狠的地方是它的学习闭环——用得越久越懂你。不是客套话,是真的会越来越聪明。

这套系统叫GEPA(Genetic-Pareto Prompt Evolution),ICLR 2026 Oral论文,学术级别的东西。说白了就是:Hermes解决一个问题后,会自动把解决方法写成Skill文档存下来,下次遇到类似问题直接调用。不是简单的"记住你上次说了什么"那种,而是真正的知识积累——四层渐进式记忆架构,从短期上下文到项目级知识到通用技能,层层递进。

嗯……这有点像什么呢,像一个程序员把踩过的坑都记在笔记里,而且永远不会忘。

Codex在4月更新里也加了Memory预览功能——能记住你的偏好、修正过的错误、上次的项目上下文。老实说,目前还只是Enterprise和Edu用户能用,Plus/Pro还在排队。而且更偏"记住偏好"而非"自主学习",跟Hermes那种"AI自己学"的模式还有差距。

WorkBuddy这边有个"专家团"系统——24个专家团、160位AI角色,用户可以自己创建"专家分身"。比如一个内容创作者把自己做短视频的方法论封装成分身,别人可以直接调用。但这是"人教AI"的模式,跟Hermes的"AI自己学"不一样。

生态协同:WorkBuddy的主场

说到生态,WorkBuddy是真的有东西。

背后是腾讯整张网——企业微信、腾讯文档、QQ邮箱、微云、腾讯会议……WorkBuddy不是站在这些产品外面调它们的接口,而是直接住了进去。你在腾讯文档里说一句话,WorkBuddy直接在文档里完成修改,不用下载、上传、切换应用。怎么讲呢,这个体验是真的很丝滑。

更绝的是微信直连——小程序版上线后,你可以从电脑让专家团开始干活,出门了打开微信小程序说一句话,回家电脑上材料已经改好。他们内部管这个叫"流动的上下文"。

马化腾在一季度财报会上直接点名:"效率智能体解决方案已初见成效,WorkBuddy目前是中国使用最广的效率智能体服务。"第三方数据显示月访问量885万,领先第二名2.6倍。

反观Codex和Hermes:

  • Codex的生态是插件体系——4月更新一次上了90+插件,GitHub、Slack、Notion、Figma、Linear都有。走的是"策展式"路线,每个插件都经过安全审核,跟OpenClaw那种3千多个未审核的MCP完全不同。说实话这个策略更聪明,90个可信的比3千个未知的强
  • Hermes的生态是消息平台——Telegram、Discord、Slack、WhatsApp、Signal,你能想到的通讯工具它都接了。但更像是"多入口"而非"深度嵌入"

三种生态策略:Codex是插件商店、Hermes是多平台网关、WorkBuddy是原生居住。

模型与定价:差距最大的地方

维度Codex 桌面版Hermes AgentWorkBuddy
默认模型GPT-5.4 / GPT-5.3-Codex自选(200+)混元 / DeepSeek / Hy3
模型自由度仅OpenAI200+模型可选5大模型切换
本地部署✅(vLLM完全本地)
免费额度ChatGPT Free有限体验完全免费开源新用户5000 Credits
付费方案Plus $20/月,Pro $200/月模型API费用约800元/月订阅

模型这块差异真挺大的。Hermes通过OpenRouter接200+模型,还支持vLLM完全本地运行——隐私敏感的场景,基本只有它一个选择。Codex绑死在OpenAI模型上,没得选但不用选。WorkBuddy接了混元、DeepSeek、Hy3等5大模型,接入Hy3 preview后首响速度提升54%,端到端任务时长缩短47%,这个进步确实不小。

架构哲学:为什么它们走出了三条路

Codex:超级应用哲学

桌面App → 多Agent并行 → Computer Use操控全电脑 → Skills扩展 → 90+插件 → Memory → 持久偏好记忆

Codex的核心假设是:Agent应该像操作系统一样,操控你电脑上的一切。从终端编码到GUI操控到图片生成到定时任务,一个App全搞定。这很苹果——封闭但体验一致。

Hermes:自举进化哲学

消息网关 → 核心引擎 → GEPA自进化 → 持久记忆 → 技能自动积累 → 子智能体 → 并行委托 → 执行环境 → 本地/Docker/SSH/Modal

Hermes的核心假设是:Agent应该像生命体一样,越用越聪明。它不追求大而全的功能覆盖,追求的是"用三个月后它比任何新工具都懂你"。这很开源——开放但需要耐心。

WorkBuddy:生态嵌入哲学

CodeBuddy Agent SDK → WorkBuddy桌面端 → 微信/企微/QQ直连 → 腾讯文档/会议/邮箱 原生居住 → 专家团/分身 → 160+AI角色 → CloudAgent → Harness云端托管 → SkillHub → AI技能社区

WorkBuddy的核心假设是:Agent的竞争力不在于自身多强,而在于身后那张能被它调用的网有多密。它不操控你的电脑,它直接住在你的工作环境里。这很腾讯——生态强但绑定感也强。

腾讯云智能体产品负责人黄广民有个公式我挺认同的:Agent = 模型 × 上下文 × 循环。模型决定上限,上下文和循环决定能不能稳定逼近上限。大多数人不会撞到模型的上限,大多数人栽在上下文和循环上。

到底谁适合你?

你是全职开发者,需要桌面级编码体验

👉Codex 桌面版

300万周活不是吹的。Computer Use帮你操控Figma和浏览器,多Agent并行跑任务,PR review直接在App里完成,SSH连远程开发机——整个开发流程一条龙。已经在ChatGPT生态里的,Plus $20/月就够日常用了。

你在乎隐私,数据不能出本机

👉Hermes Agent

这个真没得选。MIT开源可审计,vLLM完全本地运行,数据全存在本地,零追踪零遥测。而且用三个月后它比任何工具都懂你的项目风格和偏好。金融、医疗、国防场景,别犹豫。

你在中国,需要办公自动化

👉WorkBuddy

微信直连、腾讯文档原生、小程序追任务——光这三条就足够了。24个专家团覆盖从写方案到做PPT到数据分析,非技术人员10分钟上手。月访问885万、DAU国内第一,数据已经说明问题了。

你是"一人公司"创业者

👉WorkBuddy

一个人开公司最怕的不是没想法,是琐碎。WorkBuddy上有用户搭了6个AI员工岗位——内容策划、销售转化、设计交付、数据分析、客户服务、项目管理——传统6人团队月成本5到8万,他每月800块订阅费就跑起来了。这个性价比真的没话说。

你是AI研究者,需要训练和微调

👉Hermes Agent

内置Atropos框架,GEPA算法,轨迹导出,强化学习训练。这是唯一把"智能体训练"作为一等公民来支持的工具。157K+ GitHub Stars说明研究社区认它。

几句大实话

维度Codex 桌面版Hermes AgentWorkBuddy
一句话操控电脑的超级App越用越聪明的自进化智能体住在微信里的AI员工
核心优势Computer Use、多Agent并行、OpenAI生态自进化学习、隐私优先、模型自由微信直连、腾讯生态、开箱即用
核心劣势仅macOS Computer Use、绑死OpenAI生态年轻、非开发者门槛高闭源、非腾讯生态绑定感强
适用人群OpenAI生态开发者隐私敏感/研究者中国职场人/一人公司

讲道理,没有最好的工具,只有最合适的场景。Codex拼操控,Hermes拼进化,WorkBuddy拼生态——选哪个取决于你最看重什么。


本文基于2026年5月的公开信息写的,产品迭代飞快,建议以官方最新文档为准。有啥问题评论区聊聊,我都在。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询