上一篇我们读了整个系列的导读——Harness Engineering 是什么、要解决什么问题、有哪些主流框架。今天这篇换个角色——给你一张完整的地图。
学一个新领域最怕的不是内容多,而是不知道自己在哪、还差多远、哪些是重点哪些可以跳过。这篇文章就是干这个的:知识图谱 + 分层体系 + 推荐学习路径 + 里程碑自测,从零到落地,一张图说清楚。
01 | 先搞清楚:Harness Engineering 要解决什么问题
用 AI 写代码,有三个会反复踩到的坑:
第一个坑:Context Rot(上下文腐烂)
对话越长,AI 输出质量越差。不是模型变笨了,是上下文窗口里的信息密度越来越低——早期的决策、约定、上下文全混在一起,AI 开始「遗忘」,甚至自相矛盾。这个现象有论文专门研究过,叫「Lost in the Middle」——中间部分信息的召回率显著低于头尾。
第二个坑:决策遗忘
你跟 AI 说「我们这个项目用下划线命名法」,它这轮记住了,下轮重开会话又忘了。决策活在对话里,不活在代码里,永远是暂时的。
第三个坑:协作不一致
多人用 AI 协作,每个人的 AI 行为完全不同——没有共同的约定、没有统一的流程、没有可复现的标准。
Harness Engineering 针对这三个问题,分别提出三个核心策略:
- 决策外化为文件(空间维度):把决策从对话搬到文件系统,让它活在代码旁边
- 流程结构化为阶段(时间维度):把端到端开发切分为有序阶段,每个阶段有清晰的输入输出
- 任务原子化为单元(资源维度):把大任务拆成可独立执行的小单元,每个单元在独立的上下文里完成
三者协同,才构成完整的 Harness。只做其中一个,效果很有限。
02 | 四大框架家族图谱
现有的 Harness 框架可以按「解决哪个维度的问题」分成四个家族:
规范驱动开发(SDD)— 决策外化的主战场
| 框架 | 适合场景 | 核心机制 |
|---|---|---|
| Spec-Kit | 绿地项目(从零开始) | 五阶段规范先行流程 |
| OpenSpec | 棕地项目(已有代码库) | Delta Spec 增量式规范 |
| Kiro (AWS) | AWS 生态 | 类似 OpenSpec 的规范驱动 |
上下文工程(Context Eng)— 资源维度的极致代表
- GSD:波次执行(Wave Execution)调度模型,把大任务拆成多波次并行的 Sub-Agent 执行,每个 Sub-Agent 独立上下文,完全规避 Context Rot
能力增强(Augment)— 给 AI 装「外挂」
- ECC:Skills / Agents / Commands 三层架构,加上红蓝队对抗审计机制(AgentShield),解决的是「AI 能力如何组织和安全管控」的问题
编排框架(Orchest)— 多代理协作
- OMC:多代理编排,解决的是多个 Agent 如何协同、任务如何分发、结果如何汇聚
03 | 知识分层:哪些必须掌握,哪些可以按需学
不是所有概念都一样重要。按优先级分四层:
核心层(必须掌握,入门就要懂)
| 概念 | 一句话定义 |
|---|---|
| Harness Engineering | 用工程化基础设施约束 AI 编码代理的方法论 |
| Context Rot | LLM 因长上下文累积导致的输出质量退化 |
| 规范驱动开发 SDD | 规范先于代码的开发范式 |
| 决策外化 | 把决策从对话搬到文件系统 |
| 流程阶段化 | 把端到端编程切分为有序阶段 |
| 任务原子化 | 把大任务拆为可独立执行的单元 |
理解层(帮助深度理解,学完核心再看)
| 概念 | 与核心的关系 |
|---|---|
| Constitution | 项目级不可妥协的原则,决策外化的最高层 |
| Delta Spec | 增量式规范(只描述变更部分),OpenSpec 的核心机制 |
| Sub-Agent | 独立上下文的子代理,任务原子化的执行载体 |
| Wave Execution | 任务波次并行执行,GSD 的核心调度模型 |
| Lost in the Middle | 长上下文中部信息召回率下降,Context Rot 的理论根源 |
| Hooks | 事件触发的自动化脚本,ECC 的核心机制 |
进阶层(高级用法,深入某个框架时再看)
- Brownfield-First:棕地优先设计哲学(OpenSpec 的设计哲学)
- Red/Blue/Auditor:红蓝队对抗审计(ECC 的安全机制)
- AgentShield:ECC 的安全审计子系统
- DAG 任务依赖:有向无环图管理任务依赖关系
相关领域(有背景更好,没有也不影响)
DevOps、领域驱动设计(DDD)、MLOps——Harness 有大量借鉴这些领域的思想。
04 | 推荐学习路径:五个阶段,从 0 到落地
阶段 0:建立全局认知(你现在在这里)
目标:能用一段话向同事解释 Harness Engineering 是什么,能区分 Vibe Coding、Spec Coding、Harness Engineering 三个概念,能说清 Context Rot 的成因。
完成这篇文章就算过了。
阶段 1:吃透三个核心原理
目标:看到任何新 Harness 框架,能立刻识别它在三个维度上分别做了什么。
- 核心原理:决策外化为文件
- 核心原理:流程结构化为阶段
- 核心原理:任务原子化为可独立执行的单元
完成标志:看到 GSD,能说出「它主要解决任务原子化 + 上下文管理」;看到 ECC,能说出「它主要解决能力增强 + 决策外化(通过 Skills 文件)」。
阶段 2:深扒三类代表框架
目标:通过 OpenSpec、GSD、ECC 这三个极致代表,分别掌握「规范驱动」「上下文工程」「能力增强」三种设计范式。
完成标志:
- 能描述 OpenSpec 的 Delta Spec 设计哲学,并解释为什么适合棕地
- 能搭建一个 200K Token 上限、自动
/clear的 GSD 工作流 - 能描述 ECC 的三层架构(Skills / Agents / Commands),能解释红蓝队审计的价值
阶段 3:编排与组合(进阶)
目标:学习如何把多个框架组合起来,发挥 1+1>2 的效果。
这里没有标准答案,更多是「看真实案例、自己试、然后复盘」。
阶段 4:落地实战(最终目标)
选一个小项目,走完「快速试用与适配性评估」→ 根据评估结果决定「直接落地」还是「定制设计」。
三条铁律,贯穿始终:每个决策外化 + 严格走阶段 + 任务原子化。
完成标志:
- 完成试用评估报告
- 项目中已稳定运行选定的工作流(或确认「暂不实施」是合理决策,并知道为什么)
05 | 学习里程碑自测
用这个清单检验自己在每个阶段的掌握程度:
阶段 1 自测(核心原理)
- 能用 30 秒解释什么是 Context Rot
- 能说出「决策外化」解决的三个具体问题
- 能说出「阶段化」的三大原则(先 What 后 How、先全局后局部、先拆解后执行)
- 能说出「原子化」的三个标准(足迹 < 50%、依赖闭包、二元判定)
阶段 2 自测(框架理解)
- 能在白板上画出 Spec-Kit 的五阶段工作流
- 能解释 OpenSpec 的 Delta Spec 三种操作(ADDED / MODIFIED / REMOVED)
- 能解释 ECC 三层架构(Skills / Agents / Commands)的关系
- 能说出「红蓝队审计」在 ECC 中是什么角色
阶段 3 自测(系统选型)
- 给定一个项目场景(绿地/棕地/合规),能给出推荐框架并说明理由
- 能解释为什么 OpenSpec 不适合从零搭建(vs Spec-Kit)
- 能解释 GSD 和 SDD 框架的互补关系
阶段 4 自测(组合实战)
- 能在自己项目中搭建 constitution.md
- 能用 OpenSpec 提案一个真实变更(propose → apply → archive)
- 能写出一份原子化的 tasks.md(每条 30 分钟内可完成)
06 | 你现在在哪?薄弱点快速诊断
根据大多数刚入门的工程师的情况,最容易缺的不是理论而是工程实现:
| 可能已经熟悉 | 仍需补强 |
|---|---|
| 微服务架构基础 | GSD 的子代理 + 波次执行如何真正落地 |
| AI 编程基础流程 | 多框架组合策略:SDD + 上下文工程如何混搭 |
| 某个框架的基本使用 | 团队推行:如何让团队接受 Harness(技术之外的问题) |
推荐深入方向:
- 优先:GSD 实战(上下文工程这块最容易被跳过,但效果最明显)
- 其次:选一个小项目做端到端的 Harness 落地
- 可选:深入理解 ADR、Living Documentation 等经典实践
总结
- 三大核心问题:Context Rot、决策遗忘、协作不一致——Harness Engineering 针对这三个问题给出了系统性解法
- 四大框架家族:规范驱动(SDD)、上下文工程、能力增强(ECC)、编排框架——每个家族解决不同维度的问题,可以组合使用
- 知识要分层学:核心层必须掌握,理解层帮助深度理解,进阶层按需学,不要一上来就陷入细节
- 五阶段路径:全局认知 → 核心原理 → 深扒框架 → 编排组合 → 落地实战,每个阶段有明确的完成标志
- 自测清单是最好的指南针:不用问别人「我学得够了吗」,对着清单,能答上来就算过,答不上来就知道下一步学什么
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~