公章遗失登报多少钱?公章遗失登报怎么办理?一文了解
2026/6/17 21:56:55
🍋🍋AI学习🍋🍋
🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
初检阶段(如向量相似度检索)通常采用高效但粗糙的匹配方式:
text-embedding-ada-002)虽然能捕捉语义,但对细粒度语义匹配、逻辑一致性、上下文依赖等能力有限。🌰 举例:
用户问:“Transformer 模型中 LayerNorm 的作用是什么?”
初检可能召回一篇讲“Transformer 架构综述”的文章(包含 LayerNorm 字眼),但真正解释其作用的段落可能在另一篇更专业的论文中。
重排序的目标就是把后者排到前面。
对初检返回的 top-K(如 K=50)候选文档,使用一个更强、更精细的模型重新计算 query 与每个文档的相关性分数,再按新分数排序,取 top-N(如 N=3~5)送入 LLM。
✅ 本质:粗排(fast but noisy) + 精排(slow but accurate)
这是目前最主流、效果最好的方式。
1[CLS] query: What is LayerNorm? [SEP] passage: In Transformer, LayerNorm is applied after residual... [SEP][CLS]token 的 logits,经 sigmoid 得到 0~1 的相关性分数。对比:
- Bi-encoder(初检用):query 和 doc 分别编码 → 计算余弦相似度(快,可索引)
- Cross-encoder(重排用):联合编码 → 精确打分(慢,不可索引)
| 模型 | 特点 | 适用场景 |
|---|---|---|
| BGE-Reranker(智源) | 开源、支持中英文、轻量高效 | 中文 RAG 首选 |
| Cohere Rerank | 商业 API,效果极佳,支持长文本 | 企业级应用(付费) |
| ColBERTv2 | 延迟交互(late interaction),比 cross-encoder 快 | 平衡速度与精度 |
| LLM-based Rerank | 用 GPT-4 / Claude 直接判断相关性(Zero-shot) | 小规模、高价值场景 |
💡 推荐:BGE-Reranker-v2-m3(多语言、小模型、效果好)
| 关注点 | 说明 |
|---|---|
| Top-K 选择 | 初检召回太多 → 重排慢;太少 → 可能漏掉好结果。通常 K=30~100 |
| 计算开销 | Cross-encoder 无法预计算,需实时推理。可考虑缓存或异步处理 |
| 长文本处理 | 超过模型最大长度(如 512)时需截断或滑动窗口 |
| 领域适配 | 通用 reranker 在专业领域(如医疗、法律)效果下降,建议微调 |
| 多语言支持 | 确保 reranker 支持你的语言(BGE 系列支持中文) |
| 评分归一化 | 不同 query 的分数分布不同,避免直接比较绝对值 |
🌰 经典例子(HotpotQA 数据集):
“Who is the founder of the company that created TensorFlow?”
需要两跳:
- TensorFlow 是谁开发的?→ Google
- Google 的创始人是谁?→ Larry Page & Sergey Brin
最终得到答案。
📌 关键:Query 生成质量决定成败。
| 关注点 | 说明 |
|---|---|
| 跳数控制 | 通常 2~3 跳足够,更多跳易引入噪声 |
| 查询改写质量 | 使用强 LLM(如 GPT-4)生成 sub-query 效果更好 |
| 去重机制 | 避免重复检索相同文档(可用 embedding 或 hash 去重) |
| 融合策略 | 如何合并多跳结果?可拼接、加权、或让 LLM 综合 |
| 评估难度 | 需要多跳 QA 数据集(如 HotpotQA、2WikiMultihop) |
| 延迟 vs 精度 | 多跳增加响应时间,需权衡用户体验 |