【COZE-06】知识库构建与RAG应用 - 打造企业级AI专业助手-港品优选

COZE_06_知识库RAG应用

【COZE-06】知识库构建与RAG应用 - 打造企业级AI专业助手

从技能调用到知识检索，手把手教你构建具备专业领域能力的AI智能体

知识库构建与RAG应用思维导图

概述

在前几篇文章中，我们已经完成了扣子平台入门、人设设计、对话开场白、Skill开发和工作流编排的学习。本篇文章将聚焦于两个核心能力：技能（Skill）的使用和知识库（Knowledge Base）的构建，这是让AI智能体从“通用助手”进化为“领域专家”的关键所在。

你能学到什么

深入理解扣子平台的技能体系：类型、限制、使用方式
掌握知识库的完整构建流程：从数据源到检索策略
理解RAG（检索增强生成）的技术原理与实现
学会配置召回策略、查询改写、结果重排等高级功能
掌握常见问题的排查与解决方案
了解扣子知识库与竞品的对比优势

适用场景

企业内部知识库问答机器人
产品文档/技术文档智能助手
客服机器人的知识增强
专业领域咨询（如法律、医疗、金融）
私有知识库的AI应用开发

一、技能体系全解

1.1 为什么需要技能

在扣子平台上，技能（Skill）是一个专为特定领域设计的知识库和工具包。它用于指导智能体如何完成指定的任务。当智能体“装备”了合适的技能后，在处理专业任务时会表现出更好的理解和执行能力。

技能的核心价值在于三个维度：

维度	说明	示例
隐性知识显性化	将专家经验封装为可复用的操作规范	客服话术、销售技巧
任务解决方案封装	把复杂的操作步骤固化为可一键执行的技能	数据分析、报告生成
跨Bot复用	一个技能可以被多个Bot引用	通用翻译、图像处理

举个实际场景：如果你的Bot需要处理“请假审批”流程，没有技能时它可能需要每次从头理解需求；但装备了“HR审批流程”技能后，它就能准确理解请假类型、年假计算、审批权限等专业知识。

1.2 技能类型详解

扣子平台中的技能分为以下四类：

官方技能

由扣子官方提供的内置技能，无需安装，可直接使用。这类技能经过官方优化和测试，稳定性和兼容性有保障。

常见官方技能包括： - 联网搜索：获取实时网络信息 - 图片理解：分析图片内容 - 文档处理：PDF、Word等文档解析 - 代码执行：Python代码运行环境

第三方技能

由社区开发者创建的技能，分为免费技能和付费技能。

免费技能：任何用户都可以免费安装使用，通常是基础功能
付费技能：开发者可以设置价格或订阅模式，实现技能变现

扣子平台的技能商店为开发者提供了完整的变现渠道，这是其生态系统的重要一环。

自定义技能

由开发者本人创建的技能，需要先“制作”技能，然后“部署”后方可使用。

制作技能有两种方式： 1.对话转技能：将满意的对话任务自动总结为可复用的操作说明书 2.手动创建：从零开始定义技能的功能和说明

自定义技能的制作我们已在COZE-04文章中详细讲解，本篇重点介绍技能的使用。

企业技能（仅企业版）

仅限企业员工使用，是企业级应用的重要能力。企业可以： - 在企业内部知识库中创建技能 - 控制技能的可见范围和使用权限 - 实现企业私有知识的保护

1.3 技能数量限制

扣子平台对技能使用有以下限制：

┌─────────────────────────────────────────────────────────┐ │ 技能数量限制 │ ├─────────────────────────────────────────────────────────┤ │ • 第三方技能：每个用户最多启用 30 个 │ │ • 官方技能：无数量限制 │ │ • 自定义技能：无数量限制 │ │ • 企业技能：由企业管理员配置 │ └─────────────────────────────────────────────────────────┘

为什么限制30个？

这个限制主要是为了： 1.性能考量：过多技能会增加智能体的决策复杂度 2.成本控制：技能调用涉及Token消耗 3.管理便利：避免用户“技能堆积症”

当启用数量超过30个时，可以停用不常用的技能来释放名额。

1.4 技能使用方式

在扣子中，使用技能有三种主要方式：

方式一：自动匹配（默认）

在扣子首页对话框中输入任务指令，扣子AI会自动在技能商店中查找相关技能。

用户输入："帮我分析这份销售报告" ↓ 扣子AI识别意图："数据分析" ↓ 自动匹配"销售数据分析"技能 ↓ 调用技能完成任务

这种方式的优点是零配置、零学习成本，适合通用场景。

方式二：商店选用

在技能商店中手动选择感兴趣的技能，安装后再使用。

操作流程： 1. 进入扣子首页 → 点击技能入口 2. 浏览技能商店 3. 选择技能 → 点击安装 4. 在对话中点击使用该技能

方式三：@指定技能（推荐）

在扣子首页文本框中输入@，在技能页签中选择要使用的技能，实现精确调用。

┌──────────────────────────────────────┐ │ @销售分析技能 │ │ 请帮我分析Q2季度的销售数据... │ └──────────────────────────────────────┘

这种方式的优点是： -明确指定：避免AI误选技能 -精确控制：适合有多个相关技能的场景 -调试方便：便于排查技能调用问题

1.5 技能操作管理

安装技能

对于技能商店和企业商店中的技能，必须安装后才能使用。

安装流程：发现技能 → 点击安装 → 授权确认 → 安装完成

安装后的技能会出现在“我的技能”列表中。

启用/停用

安装技能后，默认为启用状态。如果安装数量超过30个限制，需要停用部分不常用的技能。

启用/停用操作不影响已安装的技能，只是控制是否参与自动匹配。

复制改造

对于开源或公开的技能，可以将其复制到自己的工作空间进行修改和定制。

复制场景： • 原技能功能接近但不满足需求 • 想学习优秀技能的设计思路 • 需要基于现有技能二次开发

二、知识库核心能力

2.1 知识库的价值

扣子平台的知识库功能是解决大模型幻觉和专业知识不足问题的核心技术方案。

在实际应用中，大模型存在以下痛点： -知识截止日期：模型知识有截止时间，无法获取最新信息 -专业领域不足：通用模型对垂直领域知识掌握有限 -幻觉回答：可能生成看似合理但错误的内容

知识库通过检索增强生成（RAG）技术，让模型能够“看到”并“引用”你的私有知识，从根本上解决上述问题。

2.2 知识库的两大能力

扣子知识库功能包含两个核心能力：

能力一：数据管理与存储

扣子支持从多种数据源上传和存储外部知识内容：

数据源类型	支持格式	上传方式
本地文档	PDF、Word、TXT、Excel、PPT	直接上传
在线数据	网页、API	同步抓取
飞书文档	飞书在线文档	授权接入
Notion	Notion数据库	OAuth授权
API数据	结构化API	API拉取

上传后，系统会将知识内容自动切分为内容片段（Chunk）进行存储，这是后续检索的基础单元。

文档上传 → 自动切片 → 向量化存储 → 检索就绪 ↓ "智能切片算法"保证语义完整性

能力二：增强检索

知识库提供了多种检索方式，对存储的内容片段进行精准召回：

混合检索：结合全文检索和语义检索的优势
语义检索：像人类一样理解词与词、句与句之间的关系
全文检索：基于关键词进行传统倒排索引检索

2.3 知识库类型

扣子平台支持多种知识库类型，适应不同场景：

文本知识库

最常见的知识库类型，用于存储和检索纯文本内容。

适用场景： - 产品手册、帮助文档 - 企业内部规章制度 - 常见问题解答（FAQ） - 技术文档、API文档

表格知识库

用于结构化数据的存储和检索，表格数据会保留其表格结构。

适用场景： - 产品参数表、价格表 - 员工信息表、组织架构 - 财务数据、报表 - 配置参数表

表格知识库的优势在于能够理解表格的行列关系，进行跨行跨列的关联查询。

照片知识库

用于存储和检索图片内容，支持图片描述的语义检索。

适用场景： - 产品图片库 - 素材库管理 - 视觉问答 - 图片标注检索

火山知识库

扣子与字节跳动火山引擎深度集成的知识库类型，支持更强大的数据处理能力。

分为两种形态： -结构化知识库：类似数据库的表格形式 -非结构化知识库：支持文档、网页等多种非结构化数据

2.4 知识库数量限制

┌─────────────────────────────────────────────────────────┐ │ 知识库数量限制 │ ├─────────────────────────────────────────────────────────┤ │ 单个智能体最多可绑定 150 个知识库 │ │ 知识库类型：扣子知识库 + 火山知识库 │ └─────────────────────────────────────────────────────────┘

150个知识库的容量对于绝大多数应用场景来说已经非常充裕。企业级应用建议： - 按主题分类：产品知识、客服知识、技术文档 - 按部门分类：销售知识、HR知识、财务知识 - 按渠道分类：不同Bot引用不同知识子集

三、检索增强配置详解

3.1 召回配置体系

知识库的召回配置决定了“模型能看到哪些知识”，是RAG效果的核心环节。

调用方式

自动调用

智能体在每一轮对话中都会自动调用知识库。

用户：今天天气怎么样？ 知识库：自动检索 → 返回相关内容（如果有） 模型：结合知识库内容生成回答

适用场景： - 需要知识库作为基础能力 - 每次回复都可能涉及知识库内容 - 对召回速度要求较高

按需调用

智能体根据提示词自行判断是否调用知识库。

用户：介绍一下我们的产品 提示词：如果你不确定答案，再查询知识库 模型：先尝试回答，不确定时再检索

适用场景： - 希望减少不必要的知识库调用 - 知识库内容较专业，不需要每次都检索 - 成本敏感场景

搜索策略

混合检索

同时使用向量语义检索和关键词全文检索，融合两者的优势。

混合检索 = 语义相似度 × 权重 + 关键词匹配 × 权重

优势： - 既能理解语义（如“苹果”的多种含义） - 又能精准匹配关键词 - 召回率最高

语义检索

基于Embedding向量模型，理解查询的语义含义。

# 语义检索示意 query_embedding = model.encode("如何申请年假") # 返回：申请年假需要满足什么条件、流程是什么 doc_embedding = model.encode("员工请假管理制度...") # 计算余弦相似度，召回相关文档

适用场景： - 查询表述与文档表述存在差异 - 同义词、多义词场景 - 需要理解意图而非字面

全文检索

基于传统倒排索引，精准匹配关键词。

适用场景： - 查询中包含明确的术语、型号 - 文档有标准化的关键词 - 需要精确匹配的查询

最大召回数量

设置从检索结果中返回多少个内容片段给大模型使用。

设置值	效果	适用场景
1-3	召回片段少，上下文简洁	单一答案型问题
5-10	平衡召回量	综合性问题
10+	召回量大，可能含噪音	需要多角度分析

建议：根据回答复杂度调整，简单问题1-3个，复杂分析5-10个。

最小匹配度

设置相似度阈值，低于该阈值的片段不会被返回。

匹配度设置过高 → 可能召回不足 匹配度设置过低 → 可能召回噪音内容

建议初始值设为0.6-0.7，根据实际效果调整。

3.2 查询改写

根据对话历史对用户输入的Query进行优化或重构，提升检索准确率。

为什么需要查询改写？

用户输入往往存在以下问题：

问题类型	示例	改写后
指代不明	“它的价格是多少”	“iPhone 15的价格是多少”
表达模糊	“那个产品”	“智能手表Pro的产品介绍”
口语化	“咋申请退货啊”	“如何申请退货退款流程”
缺少上下文	“续费怎么操作”	“会员续费怎么操作”

扣子的查询改写能力

扣子平台支持基于对话历史的智能改写：

{ "对话历史": [ {"role": "user", "content": "iPhone 15有什么亮点？"}, {"role": "assistant", "content": "iPhone 15的主要亮点包括..."}, {"role": "user", "content": "那价格呢？"} ], "改写后查询": "iPhone 15的价格是多少" }

使用建议：开启查询改写功能可以显著提升多轮对话场景下的检索效果。

3.3 结果重排

根据相关性或质量对检索到的文档切片进行重新排序，优化最终呈现给模型的上下文顺序。

为什么需要重排？

原始召回顺序可能存在的问题：

语义相关性排序：向量相似度高但实际回答效果未必最好
信息密度不均：部分切片可能包含更多有用信息
位置偏差：相关内容被埋没在后面

重排策略

扣子支持的重排维度：

重排维度	说明
相关性重排	根据与Query的语义相关性排序
质量重排	根据切片内容质量（完整性、信息量）排序
多样性重排	避免召回内容过于相似，保证多样性
自定义权重	根据业务需求设置综合权重

3.4 回复配置

无召回回复

当知识库没有召回有效切片时的回复话术。

推荐配置： "抱歉，关于这个问题我没有找到相关信息。 您可以通过以下方式获取帮助： • 联系人工客服 • 拨打热线电话：400-xxx-xxxx • 发送邮件至 support@example.com"

好的无召回回复应该： - 承认知识库不足，避免瞎编 - 提供替代解决路径 - 引导用户转人工或提交反馈

显示来源

将召回的知识库原始切片呈现给用户，增加回答可信度。

┌────────────────────────────────────────────┐ │ 回答内容... │ │ │ │ 📚 参考来源： │ │ [1] 《产品手册V2.3》第5.2节 │ │ [2] 《客服知识库》- 退换货政策 │ └────────────────────────────────────────────┘

四、RAG原理与实现

4.1 RAG技术概述

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将信息检索与语言模型生成相结合的技术架构。

┌─────────────────────────────────────────────────────────────────┐ │ RAG 架构 │ ├─────────────────────────────────────────────────────────────────┤ │ │ │ 用户查询 ──→ 检索模块 ──→ 文档片段 │ │ │ ↓ │ │ │ 上下文组装 │ │ ↓ ↓ │ │ 答案生成 ←───────────────────── 大语言模型 │ │ │ └─────────────────────────────────────────────────────────────────┘

RAG的核心价值：

优势	说明
知识时效性	可接入最新文档，突破模型知识截止日期
专业知识	可注入私有领域知识，弥补通用模型不足
可溯源性	回答有据可查，降低幻觉风险
成本效益	相比Fine-tuning，成本更低、更灵活
可更新性	更新知识库无需重新训练模型

4.2 向量Embedding技术

什么是Embedding？

Embedding是将文本映射到高维向量空间的技术，使得语义相似的文本在向量空间中距离更近。

# Embedding示例 text1 = "如何申请年假" text2 = "年假申请流程是什么" text3 = "今天天气不错" embedding1 = model.encode(text1) # [0.12, -0.34, 0.56, ...] embedding2 = model.encode(text2) # [0.11, -0.35, 0.58, ...] embedding3 = model.encode(text3) # [-0.78, 0.23, -0.45, ...] # 计算余弦相似度 similarity(text1, text2) # 0.95 (高相似) similarity(text1, text3) # 0.12 (低相似)

Embedding模型选择

扣子平台使用的Embedding模型需要考虑：

维度	考量因素
语言支持	中文/英文/多语言
向量维度	维度越高表达能力越强，计算成本越高
模型大小	影响推理速度和成本
领域适配	通用模型 vs 垂直领域模型

4.3 切片策略

为什么要切片？

原始文档通常很长，无法全部送入模型上下文。切片是将文档切分为适合检索和理解的小片段。

切片方式

切片方式	描述	适用场景
固定长度	按字符数或Token数切分	通用场景
段落切分	按自然段落边界切分	文档结构清晰的场景
语义切分	按语义完整性切分	需要保持语义连贯的场景
层级切分	按文档层级结构切分	有多级标题的文档

切片参数设置

参数	说明	建议值
chunk_size	每个切片的大小	500-1000字符
chunk_overlap	切片重叠区域	50-100字符
min_chunk_length	最小切片长度	50字符

4.4 上下文注入

将检索到的文档片段注入到Prompt中，供大模型生成答案。

## 背景知识 以下信息来自企业知识库，请基于这些信息回答用户问题： --- {召回的文档片段1} --- {召回的文档片段2} --- ## 用户问题 {用户原始Query} ## 回答要求 1. 基于上述背景知识回答 2. 如果知识库中没有相关信息，请明确告知 3. 回答要准确、简洁、有条理

4.5 幻觉抑制

RAG的一大价值在于抑制大模型的幻觉，提高回答准确性。

幻觉产生的原因

原因	说明
知识不完整	模型知识有截止日期
过度推理	从不完整信息中强行推理
表达流畅	生成流畅但错误的表述

RAG如何抑制幻觉

┌────────────────────────────────────────────────────┐ │ 幻觉抑制机制 │ ├────────────────────────────────────────────────────┤ │ │ │ 1. 知识锚定：回答必须基于检索到的文档 │ │ │ │ 2. 可溯源性：要求回答必须引用信息来源 │ │ │ │ 3. 边界识别：当文档不足以回答时，明确拒绝 │ │ │ │ 4. 置信度控制：低于阈值的回答不输出 │ │ │ └────────────────────────────────────────────────────┘

五、实战配置与最佳实践

5.1 知识库构建完整流程

步骤一：明确知识边界

在开始构建知识库之前，需要明确：

┌─────────────────────────────────────────────────┐ │ 知识边界梳理 │ ├─────────────────────────────────────────────────┤ │ • 知识库的用途是什么？ │ │ • 主要回答哪些类型的问题？ │ │ • 知识的来源有哪些？ │ │ • 知识更新的频率如何？ │ │ • 是否有敏感信息需要过滤？ │ └─────────────────────────────────────────────────┘

步骤二：数据准备

数据收集
- 从各数据源导出数据
- 清洗格式（统一编码、修复损坏文件）
- 删除敏感信息
数据清洗
- 去除HTML标签、特殊字符
- 统一格式（标题层级、列表格式）
- 补充缺失的上下文
数据标注（可选）
- 标记关键概念
- 添加分类标签
- 人工审核重要文档

步骤三：知识库创建

进入扣子平台 → 知识库 → 创建知识库
选择知识库类型（文本/表格/图片）
配置数据源和上传方式
设置切片策略
等待系统处理完成

步骤四：Bot绑定与测试

进入Bot编辑页面 → 知识库模块
添加已创建的知识库
配置召回策略（检索方式、召回数量、匹配度）
在预览窗口进行测试
根据测试结果调优参数

5.2 典型场景配置

场景一：产品FAQ问答

目标：快速准确回答用户关于产品的问题

推荐配置：

知识库类型: 文本知识库 切片策略: 段落切分，保持Q&A完整性 检索方式: 混合检索 召回数量: 3-5 匹配度阈值: 0.65 显示来源: 开启

优化建议： - FAQ文档建议按问答对组织 - 重要参数（价格、规格）单独存储 - 配置无召回回复，引导转人工

场景二：技术支持文档

目标：帮助用户解决技术问题

推荐配置：

知识库类型: 文本知识库 + 表格知识库 切片策略: 语义切分 + 层级切分 检索方式: 语义检索 召回数量: 5-10 匹配度阈值: 0.6 显示来源: 开启

优化建议： - 技术文档按产品线分类 - 故障排查文档按“问题→原因→解决方案”结构组织 - 关联配置步骤和注意事项

场景三：合同/法务文档

目标：提供准确的合同条款解读

推荐配置：

知识库类型: 文本知识库 切片策略: 条款级别切分 检索方式: 全文检索（精确匹配关键词） 召回数量: 1-3 匹配度阈值: 0.75 显示来源: 强制开启

优化建议： - 敏感条款单独标记 - 配置“仅引用，不可推断”模式 - 添加免责声明提示

5.3 常见问题与排错

问题一：召回结果不相关

症状：检索到的内容与用户问题不相关

排查步骤： 1. 检查切片是否合理（片段是否包含完整语义） 2. 调整检索方式（语义/全文/混合） 3. 调整匹配度阈值 4. 优化文档结构

解决方案：

# 调整策略 检索方式: 语义检索 # 改用语义理解 匹配度阈值: 0.7 # 提高阈值过滤噪音 召回数量: 3 # 减少召回数量

问题二：召回不足

症状：应该召回的内容没有被召回

排查步骤： 1. 检查匹配度阈值是否过高 2. 验证Embedding模型是否合适 3. 检查切片是否遗漏关键内容

解决方案：

# 调整策略 检索方式: 混合检索 # 同时用语义和关键词 匹配度阈值: 0.5 # 降低阈值 召回数量: 10 # 增加召回数量

问题三：回答质量差

症状：召回正确但回答不准确

排查步骤： 1. 检查Prompt是否要求引用知识库 2. 验证知识库内容质量 3. 评估是否需要调整模型

解决方案：

# 优化Prompt 请基于以下知识库内容回答用户问题。 如果知识库信息不足，请明确说明，不要编造答案。 回答时尽量引用具体的文档来源。

问题四：回答太长/太短

症状：回答长度不符合预期

解决方案：

# 在Prompt中控制长度 "请用3-5句话简要回答" "请详细说明，包括具体步骤和注意事项"

5.4 性能优化指南

优化一：冷启动策略

新上线的知识库，建议先用少量核心文档启动，逐步扩展。

阶段一（1-2周）：核心FAQ + 产品基础信息 阶段二（3-4周）：扩展至使用指南、常见问题 阶段三（持续）：运维文档、技术支持文档

优化二：知识库分层

根据数据重要性和使用频率分层管理：

┌─────────────────────────────────────────────────┐ │ 知识库分层架构 │ ├─────────────────────────────────────────────────┤ │ 【第一层】高频核心知识 │ │ • 核心产品信息 │ │ • 常见问题TOP100 │ │ • 重要性：高，召回优先 │ ├─────────────────────────────────────────────────┤ │ 【第二层】中频扩展知识 │ │ • 详细使用说明 │ │ • 配置指南 │ │ • 重要性：中，全量召回 │ ├─────────────────────────────────────────────────┤ │ 【第三层】低频补充知识 │ │ • 历史文档 │ │ • 归档资料 │ │ • 重要性：低，按需召回 │ └─────────────────────────────────────────────────┘

优化三：定期更新

知识库需要持续维护：

更新频率	内容类型	更新方式
实时	价格、库存	API同步
每日	公告、新闻	定时抓取
每周	FAQ优化	人工审核
每月	文档整体	版本迭代

六、与竞品对比分析

6.1 扣子 vs Dify

维度	扣子	Dify
定位	面向普通用户的AI应用平台	面向开发者的LLM应用开发平台
上手难度	低，拖拽式配置	中，需要一定技术基础
知识库	内置，支持多类型	插件扩展，需要配置
RAG能力	开箱即用，配置丰富	可配置但相对基础
定价	免费额度充足	开源自部署免费
适用场景	快速创建AI应用	企业级定制开发

6.2 扣子 vs Coze（国际版）

维度	扣子(国内版)	Coze(国际版)
模型支持	国内大模型（豆包等）	GPT-4、Claude等
数据存储	国内服务器	海外服务器
合规要求	符合国内法规	符合海外法规
技能生态	中文技能为主	国际化技能生态
企业特性	企业版支持私有部署	企业版支持云端

6.3 扣子知识库核心优势

零配置RAG：无需编写代码，即可完成知识库搭建和RAG配置
多模态支持：文本、表格、图片多种知识库类型
智能切片：自动切片算法，减少人工干预
查询改写：基于对话历史的智能查询优化
火山集成：与字节跳动生态深度集成

七、总结与展望

7.1 核心知识点回顾

┌─────────────────────────────────────────────────────────┐ │ COZE-06 知识要点 │ ├─────────────────────────────────────────────────────────┤ │ │ │ 【技能体系】 │ │ • 四类技能：官方/第三方/自定义/企业 │ │ • 第三方技能上限30个 │ │ • 三种使用方式：自动/@/商店 │ │ │ │ 【知识库】 │ │ • 两大能力：存储 + 检索 │ │ • 四种类型：文本/表格/图片/火山 │ │ • 单Bot最多150个知识库 │ │ │ │ 【RAG配置】 │ │ • 调用方式：自动 vs 按需 │ │ • 检索策略：混合/语义/全文 │ │ • 查询改写 + 结果重排 │ │ │ └─────────────────────────────────────────────────────────┘

7.2 进阶学习路径

完成本文学习后，建议继续深入以下主题：

序号	主题	推荐理由
COZE-07	插件(Plugin)开发与集成	扩展Bot的工具能力
COZE-08	Prompt工程进阶	优化知识库调用效果
COZE-09	多Agent协作	多知识库协同工作
COZE-10	企业级AI应用	生产环境最佳实践

7.3 实践建议

从小做起：先用10-20个核心文档建立知识库
持续迭代：根据用户反馈不断优化知识库
监控指标：关注召回率、准确率、用户满意度
团队协作：建立知识库维护流程和责任制度

企业官网建设流程全解析