Codex 子代理：串行 vs 并行，快多少-港品优选

系列：AI 编程工具生态挖掘｜字数：约 2800 字｜预计阅读：7 分钟

前面几篇都在 Claude Code 生态里打转。但 Codex 这边有一个 Claude Code 不具备的能力——原生子代理（Sub-Agent）并行编排。

Codex 支持在.codex/agents/下定义专用 Agent，每个有独立的系统提示、工具权限和模型。Codex 可以同时启动多个 Agent 并行执行不同任务，然后汇总结果。

社区做了大量封装——136+ 预定义子代理、50+ 可复用工作流、跨 LLM 编排。这篇文章不列清单，做一个实战对比：同一个需求，串行做 vs 并行做，差距到底多大。

Codex 子代理工作原理——.toml 定义，主 session 调用

在.codex/agents/下定义一个 Agent 文件：

# .codex/agents/test-writer.toml name = "test-writer" description = "Writes pytest tests for Python functions" tools = ["read", "write", "bash"] model = "gpt-5.1" system_prompt = """ You are a test engineer. Given a Python source file, write comprehensive pytest tests. Focus on edge cases, boundary values, and error conditions. Use parametrize for combinatorial coverage. Output ONLY the test file content — no explanations. """

然后在主 Codex session 里调用：

用户: 用 test-writer 给 src/utils/date_utils.py 写测试 同时用 code-reviewer 审查 src/utils/date_utils.py 的代码质量 然后我去泡杯咖啡

Codex 会同时启动 test-writer 和 code-reviewer 两个 Agent，并行运行。Agent 之间没有上下文共享——各干各的。

串行 vs 并行实测——同一需求，两种跑法差多少

任务：给一个中等复杂度的 Python 工具模块（date_utils.py，180 行，12 个函数）做三个操作——写测试、代码审查、生成文档。

串行模式：

一个接一个来。先让 Codex 写测试，完了再审查，完了再生成文档。

Step 1: Write tests → 4 min 12 sec Step 2: Code review → 3 min 48 sec Step 3: Generate docs → 2 min 05 sec Total: 10 min 05 sec

测试覆盖了 12 个函数中的 11 个（漏了一个私有 helper），审查发现了 3 个问题（2 个类型标注缺失、1 个潜在的时区 bug），文档准确描述了 12 个函数的参数和返回值。

并行模式：

三个 Agent 同时启动：

Agent 1 (test-writer): → Writing tests... → 4 min 52 sec Agent 2 (code-reviewer): → Reviewing code... → 4 min 18 sec Agent 3 (doc-writer): → Generating docs... → 2 min 35 sec All agents completed. Total: 4 min 52 sec (wall clock)

并行模式墙钟时间约 5 分钟，比串行快了接近一半。但有两个代价：

test-writer 慢了 40 秒（Agent 并发竞争资源，模型推理排队）
test-writer 没看到 code-reviewer 发现的问题——审查发现的时区 bug，测试里刚好也漏了

并行什么时候划算

划算的场景：

多个任务操作不同文件，互不依赖
代码审查 + 测试编写——这两个天然独立
大型重构——拆成多个子模块，每个 Agent 处理一个
多语言项目——一个 Agent 改前端，一个 Agent 改后端

不划算的场景：

任务之间有顺序依赖——Agent A 的输出是 Agent B 的输入，并行等于乱序
操作同一个文件——两个 Agent 同时改同一个文件会产生冲突
需要全局视角的任务——并行 Agent 各自为政，看不到其他人的分析

值得装的 6 个子代理

从 VoltAgent 的 136+ 子代理里，挑了几个最实用的：

Agent	用途	一句话
`code-reviewer`	代码审查	按漏洞、风格、性能逐项审查
`test-writer`	测试生成	自动 parametrize 组合覆盖率
`doc-writer`	文档生成	读函数签名和 docstring，输出 Markdown
`security-scanner`	安全扫描	OWASP Top 10 检查，硬编码密钥检测
`refactor-agent`	大型重构	拆解重构计划，分步执行，每步验证
`dependency-checker`	依赖审计	检查过时的包、已知漏洞、许可证冲突

安装单个 Agent：

npx skills@latestaddVoltAgent/awesome-codex-subagents

然后在 Codex session 里通过/agent test-writer调用。

Agent 之间的通信——别指望他们会聊天

并行 Agent 最大的陷阱：你不会自动得到"综合报告"。

三个 Agent 各自输出了结果——测试代码、审查报告、文档。但它们不会互相沟通。你得做汇总的人：

用户: 汇总 test-writer、code-reviewer 和 doc-writer 的输出， 合并成一个完整的 PR 准备报告

或者用社区工具——agent-sh/agentsys提供了一个编排层，定义了 Agent 间的输入/输出协议，自动汇总。但它还在 preview 阶段，文档不全。

目前的建议：并行 Agent 用来生成，人用来汇总。不要指望 Agent 之间自动协调。

Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

Codex 子代理	Claude Code 并行
调度方式	原生支持，`.toml`配置	通过 SubAgent tool，内置支持
Agent 隔离	独立上下文，独立执行	共享上下文，子 Agent 可传结果
适用场景	完全独立的任务并行	需要主 Agent 汇总的并行
配置复杂度	需要定义每个 Agent 的系统提示	自动继承 CLAUDE.md 规则

Codex 的子代理更适合"不同视角"的并行——安全 Agent 看安全、测试 Agent 看测试、文档 Agent 看文档。Claude Code 的子代理更适合"分块处理"的并行——主 Agent 拆任务，子 Agent 各领一块。

技能超市：1400+ 个技能里的质量筛选

GitHub 上 1400+ 个 Codex/Claude Code 技能，社区测试了 100 个，70% 不合格。几个筛选标准：

过滤掉：

"用最佳实践"类——空泛，没具体行为约束
只做一件事但描述不清的——装完不知道什么时候触发
跟其他已有技能功能重复的

留住的：

有明确的触发条件（“当 X 时做 Y”）
有具体的输出格式要求
有已知的限制说明（“不适用于 Z 场景”）

两个网站帮你找：

claudeskills.info— 151+ 技能，支持中文，兼容 14+ 平台
skillsmp.com— 多平台技能市场

并行多 Agent 能提效，但也扩大了攻击面——多个 Agent 同时跑，安全风险被放大了。下一篇同时测 AgentShield（安全扫描）和 cozempic（token 成本优化），看看防守端和成本端社区做了什么。

企业官网建设流程全解析

Codex 子代理工作原理——.toml 定义，主 session 调用

串行 vs 并行实测——同一需求，两种跑法差多少

并行什么时候划算

值得装的 6 个子代理

Agent 之间的通信——别指望他们会聊天

Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

技能超市：1400+ 个技能里的质量筛选

下一篇

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Codex 子代理工作原理——.toml 定义，主 session 调用

串行 vs 并行实测——同一需求，两种跑法差多少

并行什么时候划算

值得装的 6 个子代理

Agent 之间的通信——别指望他们会聊天

Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

技能超市：1400+ 个技能里的质量筛选

下一篇

热门文章

文章分类

标签云

相关文章

Spring AI 源码解析（二）：ChatModel 调用链路与消息处理

AI 写代码的安全性漏洞与 Token 浪费，两个工具搞定

STM32F103 RGB灯PWM调光工程（KEIL环境，J-Link/ST-Link双调试器支持）

需要专业的网站建设服务？