2026年6月8日 · RAG

Contextual Retrieval - 上下文检索：将 RAG 检索失败率降低 67%

Anthropic 提出的 Contextual Retrieval 方法，通过上下文增强与 BM25 混合检索，将 RAG 检索失败率降低 67%。

方法	Top-20 失败率	相对改善	累计改善
传统 RAG（仅语义嵌入）	5.7%	基线	-
+ 上下文嵌入	3.7%	-35%	-35%
+ 上下文嵌入 + 上下文 BM25	2.9%	-23%	-49%
+ 上下文嵌入 + 上下文 BM25 + 重排序	1.9%	-35%	-67%

rag
llm
retrieval

返回文章

View All Posts »

claude-tap: 在本地 trace viewer 中拦截和检查编码代理 API 流量

在本地 trace viewer 中拦截和检查来自 Claude Code、Codex CLI、Gemini CLI、Cursor CLI、OpenCode、Kimi、Pi、Hermes 等编码代理的 API 流量。

欢迎来到 ainaigc

本站展示 Obsidian 笔记如何经过 raw → wiki → output 三层流转，最终变成可发布的网站内容。

研究背景

传统 RAG 的上下文难题

隐式引用

数据无来源标注

跨文档引用断裂

代码片段无项目上下文

学术论文切片丢失

小说场景割裂

文本块变化：前后对比

预处理流程

核心机制详解

上下文嵌入

上下文 BM25

排序融合

Prompt Caching

上下文生成提示词

重排序增强

性能对比

六项关键发现

1. 嵌入 + BM25 优于单独嵌入

2. Voyage 和 Gemini 嵌入最佳

3. Top-20 比 Top-5/10 更有效

4. 添加上下文大幅提升检索

5. 重排序优于不重排序

6. 所有好处可叠加

实现注意事项

文本块边界策略

嵌入模型选择

自定义上下文提示词

始终运行评估

优势与局限

核心优势

局限与注意事项

多维度评估

常见问题

Q: 上下文检索需要改动现有的 RAG 系统吗？

Q: 上下文生成的 token 成本有多高？

Q: 如果知识库很小（<200K token），还需要上下文检索吗？

Q: 上下文检索支持多语言吗？

Q: 除了 Claude，可以用其他模型生成上下文吗？

Q: 文档更新后需要重新生成上下文吗？

快速开始

Related Posts

claude-tap: 在本地 trace viewer 中拦截和检查编码代理 API 流量

欢迎来到 ainaigc