Coze从入门到实战---第三章
2026/6/11 4:51:03 网站建设 项目流程

一、RAG的基本原理

RAG是一种结合知识检索和语言生成的人工智能技术,主要解决大语言模型幻觉问题

1. 传统 LLM 的缺陷?

答案:消息滞后(无法获取最新的知识)

2.RAG 的原理是什么?

答案:先将问题基于知识库检索问题相关的上下文,然后在将问题和上下文结合送入大模型回答

3.RAG 解决什么问题?

答案:大模型幻觉问题

二、RAG知识库构建的基本流程

一、支持的素材类型规格表

素材类型支持格式核心适用场景对应案例
文档类型PDF、Word、TXT攻略文章、教程文档类内容英雄攻略 PDF
表格类型Excel、CSV结构化数据、统计信息类内容英雄属性表
照片类型JPG、JPEG、PNG图像生成相关场景英雄战斗画面

二、文档预处理核心建议

  1. 内容清理:去除文档中的广告、水印等无关内容
  2. 分类整理:按主题维度对文档进行分类规整
  3. 命名规范:文件命名需包含核心关键信息,保证命名的规范性与可识别性

三、知识库构建:文档切片

文档切片的目的是为了适应大语言模型的上下文长度限制,并提升检索的精确度和效率。

切分方式

表格:三种切分方式对比
编号方式说明
按字符数切分固定长度(如每300字一段)
按符号切分按照句号、换行符、感叹号等
按语义切分识别主题变化点智能切分
一般选择方式

按照符号和字符长度一块切分:一般200-500字/段。

长度太小,上下文不完整,检索不准;长度太大,无关信息过多,干扰判断。

四、知识库构建:文档向量化

文档向量化:将切分后的文本进行向量数字化,便于计算问题和文档的相似性。

什么是向量化?

将文本转换为向量表示,示例如下:

内容向量
"问题:盲僧Q技能"[0.8, 0.6, ...]
文档1:"烹饪技巧"[0.1, 0.8, ...]
文档2:"盲僧出装"[0.7, 0.5, ...]

向量化后,语义相近的内容在向量空间中的夹角更小。通过余弦相似度算法计算拟合,相似度高的向量指向更接近的方向。

向量化作用

  • 语义理解
  • 相似度计算
  • 快速检索

五、复习

1. RAG知识库构建的主要流程?

文档准备 --> 文档切分 --> 文档向量化

2. 文档为什么要切片?

为了适应大语言模型的上下文长度限制,并提升检索的精确度和效率。

3. 文档向量化原因?

文本进行向量数字化,便于计算问题和文档的相似性。

三、创建LOL攻略知识库RAG并且运用

基本操作步骤如下:

表格:创建知识库步骤

步骤操作说明
Step 1:进入资源库Coze → 左侧菜单 → 资源库打开平台资源管理入口
Step 2:创建知识库资源 → 知识库 → 命名LOL攻略库新建并命名知识库
Step 3:上传文件拖拽/上传文件 → 支持批量上传将攻略文档导入知识库
Step 4:文档切块自动切块 → 300/500字按段落长度自动切分文档
Step 5:向量化预处理分段预处理对切分后的文本进行向量化
Step 6:查看结果预览文本处理的效果检查知识库构建结果

环节2:让 Bot 应用知识库

操作步骤如下:

表格:Bot应用知识库步骤

步骤操作说明
Step 1:进入BotCoze → 创建 → 智能体在平台创建新的智能体
Step 2:构建提示词明确角色 → 说明功能 → 规范回复格式编写Bot的提示词
Step 3:选择知识库编排模块 → 知识库 → 点击"添加知识库"将知识库关联到Bot
Step 4:结果验证调试 → 输入问题 → 验证结果测试Bot的回答效果

实现LOL游戏助手的过程

  1. 上传文件
  2. 文档切分
  3. 文档向量化
  4. 存储知识库
  5. 问题检索知识库
  6. 获取相关上下文
  7. 问题和上下文融合
  8. 送入LLM
  9. 得到预测结果

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询