从提示词工程到上下文工程:Google白皮书深度解析AI Agent记忆架构设计!
2026/5/23 18:24:47 网站建设 项目流程

简介

Google发布《Context Engineering》白皮书,宣告AI开发进入上下文工程时代。Context Engineering通过Session和Memory双脑机制,使大模型从无状态变为有状态。Session管理短期对话上下文,Memory负责长期知识存储,二者共同实现Agent的跨会话理解和个性化。生产环境需注意异步生成、用户隔离和防止记忆投毒。未来AI竞争将取决于Context Engineering的精细程度。


11月,Google 发布了一份重磅白皮书《Context Engineering: Sessions, Memory》,正式宣告 AI 开发从“Prompt Engineering”----提示词工程时代跨入“Context Engineering”—上下文工程时代。

如果说 Prompt Engineering 是提示 AI怎么说话,那么 Context Engineering 就是赋予 AI长期记忆****和个性化灵魂

今天,我们就来深度拆解这份白皮书,看看 Google 是如何设计企业级 Agent 记忆架构的。

先来看一个问题,为什么所有 AI Agent 都逃不过“上下文工程”?

我们知道,大模型天生是无状态的。每次调用,模型就是一张白纸:不记得你是谁,不记得你刚刚说过什么,不记得任务进度,不会形成知识沉淀,更不会“跨会话理解你”。

但一个真正能工作的 AI Agent,需要连续对话,需要理解任务上下文、记住用户偏好,需要形成长期知识,需要存工具调用状态,能复用过往经验。

这就是Context Engineering(上下文工程)出现的理由。 白皮书明确提出:

LLM从“无状态”变成“有状态”不是模型问题,而是工程问题。

那么, 什么是 Context Engineering?

Google 在白皮书中提出了一个比喻:Context Engineering 就像是大厨烹饪前的“备料”

过去我们做开发,往往只关注 Prompt----就像是菜谱,告诉模型要做什么。

而**Context 就像是配料----**只要你把最优质的食材(用户画像、历史记忆、当前任务状态)清洗、切好、摆在模型面前,即使是一个普通厨师也能做出一道好菜。

**Context Engineering 的核心定义是:**动态地组装和管理信息。它不仅仅是拼接字符串,而是根据当前的用户、对话历史和外部数据,策略性地选择、压缩和注入信息,最大化相关性,最小化噪声

Context Engineering的生命周期

解释一下这张图。

Fetch Context----获取上下文:Agent 首先检索上下文——例如用户记忆、RAG 文档和最近的对话事件。对于动态上下文检索,Agent 会利用用户的查询和其他元数据来识别需要检索哪些信息。

Prepare Context----准备上下文:Agent 框架动态构建用于 LLM 调用的完整提示词。虽然单独的 API 调用可能是异步的,但“准备上下文”是一个阻塞的、“热路径”过程。在上下文准备好之前,Agent 无法继续下一步。

InvokeLLMand Tools----调用 LLM 和工具:Agent 迭代地调用 LLM 和任何必要的工具,直到生成给用户的最终响应。工具和模型的输出会被追加到上下文中。

Upload Context----上传上下文:在本轮对话中收集到的新信息会被上传到持久化存储中。这通常是一个“后台”过程,允许 Agent 在异步进行记忆整合或其他后处理时,先完成当前的执行任务。

Context Engineering的核心架构:Session 与 Memory 的“双脑”机制

很多开发者容易混淆会话历史和记忆。Google 明确将它们划分为两个截然不同的系统:Session 和 Memory。

Session:你的临时工作台----即时上下文

Session 是短期的、易逝的,是“正在发生的一切”,包括当前轮对话内容,工具调用与结果,Agent 中间步骤,推理链路,当前任务进度等等。随着对话变长,Token 成本激增,模型注意力变分散,响应变慢。

Google 的解法是用压缩策略。不把整个 Session 喂给模型,而是使用滑动窗口----只看最近 N 轮对话,或用递归摘要----把旧对话总结成一段话。

Memory:长期知识

Memory 是长期的、整理过的知识,它是从 Session 中提取清洗后的高价值信息。

很关键的一点:Session 是为了保证对话的连贯性,而 Memory 是为了实现跨会话的个性化

Memory 的难点不在存储,而在“抽取与整合”

一个可用的 Memory pipeline,需要完成三件事:

**先Extraction----抽取,**从 Session 里提炼关键点,包括用户偏好,用户事实,任务状态,agent 经验,可重复利用的信息等等,是选择性提取,不是全量复制。

**再Consolidation----整合,**包括:去重,合并,冲突解决,分级,记忆衰减等等,这是 Memory 管线最复杂的部分。

**再Storage----存储,**可以是文本,JSON,Vector,Key-value,Graph。

下面这张图便是Memory抽取、整合、存储的pipeline。

Memory vs RAG:两个完全不同的概念被混为一谈了太久

很多人以为 RAG 就是Memory,其实不然。白皮书直接给出了行业最清晰的区分。

这份白皮书给出了一个非常形象的对比:

RAG 是“图书馆理员” ,它守着一座巨大的图书馆----企业文档、Wiki,它的知识是静态的事实性的,它让 Agent 成为领域专家

而Memory 是“私人助理” ,它拿着一个小本本,跟在用户身后,记录用户的喜好、习惯和过去的对话。它的知识是动态的私密的。它让 Agent 成为懂你的专家

用一张图来展示AgentMemorySessionExternal Knowledge(外部知识库/RAG)之间的信息流转关系。它是 Context Engineering 核心逻辑的完美可视化。

生产环境落地的“生死线”

在 Demo 里跑通 Memory 很简单,但在生产环境中,这份白皮书中强调了几个绝对不能踩的坑:

Memory 必须是“异步生成”----记忆的生成----Extraction & Consolidation,非常消耗算力和时间。不要让用户等, 这部分工作必须在后台异步进行。用户说完话,Agent 立刻回复,记忆在后台慢慢生成。

**需要做好用户隔离----**Memory 存储的是用户隐私。必须在架构上实现严格的用户隔离。A 用户的记忆绝对不能被 B 用户的 Agent 检索到。这不仅是 Bug,更是安全事故。

**防止记忆投毒----**小心恶意用户!如果用户故意说“我的密码是 123456”或者输入错误的指令试图误导 Agent,系统必须有类似Model Armor的层级来清洗和验证写入的数据。

未来的 AI 竞争,不再仅仅是比拼谁的模型参数更大,而是比拼谁的 Context Engineering 做得更细致。只有当 Agent 拥有了连贯的 Session 管理和深度的 Memory 系统,它才能从一个“只懂回答问题的机器”,进化成一个“真正懂你的伙伴”。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求:大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能,学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力:大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询