RAG搭建-切片召回评测与选型
2026/6/24 10:16:41 网站建设 项目流程

文章目录

    • RAG 先别急着上模型
    • 切片怎么做
    • 召回怎么搭
    • 评测怎么做
    • 选型建议
    • 结论

RAG 先别急着上模型

很多 RAG 项目失败,不是模型不行,而是前面的数据处理没做好。文档清洗、切片、召回、重排、评测,这几步决定了大部分效果。

切片怎么做

切片不是越短越好,也不是越长越好。比较稳的思路是按语义结构切,再加少量 overlap。

  • 标题、段落、代码块尽量保留边界
  • 表格和列表别硬拆
  • 过短会丢上下文,过长会稀释重点

召回怎么搭

常见做法是三路一起上:

  • 向量检索:找语义相近的内容
  • 关键词检索:补精确匹配
  • 知识图谱:补关系和多跳信息

最后再用 RRF 或 rerank 做融合,效果通常比只靠单路稳定。

评测怎么做

别只看“回答像不像”。检索阶段要看 Recall@K、MRR、NDCG、HitRate;生成阶段要看 Faithfulness、Answer Relevancy、Context Precision、Context Recall。

选型建议

  • 文档量不大,先把清洗和切片做扎实
  • 检索效果不稳,就上 hybrid
  • 生成结果容易胡说,就加重排和上下文约束

结论

RAG 的本质不是“接一个向量库”,而是把知识处理成能被稳定检索、稳定回答的工程链路。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询