Search Layer v2 — 意图感知多源检索协议

三源同级：Brave (web_search) + Exa + Tavily。按意图自动选策略、调权重、做合成。

执行流程

code

用户查询
    ↓
[Phase 1] 意图分类 → 确定搜索策略
    ↓
[Phase 2] 查询分解 & 扩展 → 生成子查询
    ↓
[Phase 3] 多源并行检索 → Brave + search.py
    ↓
[Phase 4] 结果合并 & 排序 → 去重 + 意图加权评分
    ↓
[Phase 5] 知识合成 → 结构化输出

Phase 1: 意图分类

收到搜索请求后，先判断意图类型，再决定搜索策略。不要问用户用哪种模式。

意图	识别信号	Mode	Freshness	权重偏向
Factual	"什么是 X"、"X 的定义"、"What is X"	answer	—	权威 0.5
Status	"X 最新进展"、"X 现状"、"latest X"	deep	pw/pm	新鲜度 0.5
Comparison	"X vs Y"、"X 和 Y 区别"	deep	py	关键词 0.4 + 权威 0.4
Tutorial	"怎么做 X"、"X 教程"、"how to X"	answer	py	权威 0.5
Exploratory	"深入了解 X"、"X 生态"、"about X"	deep	—	权威 0.5
News	"X 新闻"、"本周 X"、"X this week"	deep	pd/pw	新鲜度 0.6
Resource	"X 官网"、"X GitHub"、"X 文档"	fast	—	关键词 0.5

详细分类指南见 references/intent-guide.md

判断规则：

•扫描查询中的信号词
•多个类型匹配时选最具体的
•无法判断时默认 exploratory

Phase 2: 查询分解 & 扩展

根据意图类型，将用户查询扩展为一组子查询：

通用规则

•技术同义词自动扩展：k8s→Kubernetes, JS→JavaScript, Go→Golang, Postgres→PostgreSQL
•中文技术查询：同时生成英文变体（如 "Rust 异步编程" → 额外搜 "Rust async programming"）

按意图扩展

意图	扩展策略	示例
Factual	加 "definition"、"explained"	"WebTransport" → "WebTransport", "WebTransport explained overview"
Status	加年份、"latest"、"update"	"Deno 进展" → "Deno 2.0 latest 2026", "Deno update release"
Comparison	拆成 3 个子查询	"Bun vs Deno" → "Bun vs Deno", "Bun advantages", "Deno advantages"
Tutorial	加 "tutorial"、"guide"、"step by step"	"Rust CLI" → "Rust CLI tutorial", "Rust CLI guide step by step"
Exploratory	拆成 2-3 个角度	"RISC-V" → "RISC-V overview", "RISC-V ecosystem", "RISC-V use cases"
News	加 "news"、"announcement"、日期	"AI 新闻" → "AI news this week 2026", "AI announcement latest"
Resource	加具体资源类型	"Anthropic MCP" → "Anthropic MCP official documentation"

Phase 3: 多源并行检索

Step 1: Brave（所有模式）

对每个子查询调用 web_search。如果意图有 freshness 要求，传 freshness 参数：

code

web_search(query="Deno 2.0 latest 2026", freshness="pw")

Step 2: Exa + Tavily（Deep / Answer 模式）

对子查询调用 search.py，传入意图和 freshness：

bash

python3 /home/node/.openclaw/workspace/skills/search-layer/scripts/search.py \
  --queries "子查询1" "子查询2" "子查询3" \
  --mode deep \
  --intent status \
  --freshness pw \
  --num 5

参数说明：

参数	说明
`--queries`	多个子查询并行执行（也可用位置参数传单个查询）
`--mode`	fast / deep / answer
`--intent`	意图类型，影响评分权重（不传则不评分，行为与 v1 一致）
`--freshness`	pd(24h) / pw(周) / pm(月) / py(年)
`--domain-boost`	逗号分隔的域名，匹配的结果权威分 +0.2
`--num`	每源每查询的结果数

Step 3: 合并

将 Brave 结果与 search.py 输出合并。按 canonical URL 去重，标记来源。

如果 search.py 返回了 score 字段，用它排序；Brave 结果没有 score 的，用同样的意图权重公式补算。

Phase 4: 结果排序

评分公式

code

score = w_keyword × keyword_match + w_freshness × freshness_score + w_authority × authority_score

权重由意图决定（见 Phase 1 表格）。各分项：

•keyword_match (0-1)：查询词在标题+摘要中的覆盖率
•freshness_score (0-1)：基于发布日期，越新越高（无日期=0.5）
•
authority_score (0-1)：基于域名权威等级
- •Tier 1 (1.0): github.com, stackoverflow.com, 官方文档站
- •Tier 2 (0.8): HN, dev.to, 知名技术博客
- •Tier 3 (0.6): Medium, 掘金, InfoQ
- •Tier 4 (0.4): 其他

完整域名评分表见 references/authority-domains.json

Domain Boost

对特定意图，自动 boost 相关域名：

•Tutorial → dev.to, freecodecamp.org, realpython.com, baeldung.com
•Resource → github.com, docs.*
•News → techcrunch.com, arstechnica.com, theverge.com

Phase 5: 知识合成

根据结果数量选择合成策略：

小结果集（≤5 条）

逐条展示，每条带源标签和评分：

code

1. [Title](url) — snippet... `[brave, exa]` ⭐0.85
2. [Title](url) — snippet... `[tavily]` ⭐0.72

中结果集（5-15 条）

按主题聚类 + 每组摘要：

code

**主题 A: [描述]**
- [结果1] — 要点... `[source]`
- [结果2] — 要点... `[source]`

**主题 B: [描述]**
- [结果3] — 要点... `[source]`

大结果集（15+ 条）

高层综述 + Top 5 + 深入提示：

code

[一段综述，概括主要发现]

**Top 5 最相关结果：**
1. ...
2. ...

共找到 N 条结果，覆盖 [源列表]。需要深入哪个方面？

合成规则

•先给答案，再列来源（不要先说"我搜了什么"）
•按主题聚合，不按来源聚合（不要"Brave 结果：... Exa 结果：..."）
•冲突信息显性标注：不同源说法矛盾时明确指出
•
置信度表达：
- •多源一致 + 新鲜 → 直接陈述
- •单源或较旧 → "根据 [source]，..."
- •冲突或不确定 → "存在不同说法：A 认为...，B 认为..."

降级策略

•Exa 429/5xx → 继续 Brave + Tavily
•Tavily 429/5xx → 继续 Brave + Exa
•search.py 整体失败 → 仅用 Brave web_search（始终可用）
•永远不要因为某个源失败而阻塞主流程

向后兼容

不带 --intent 参数时，search.py 行为与 v1 完全一致（无评分，按原始顺序输出）。

现有调用方（如 github-explorer）无需修改。

快速参考

场景	命令
快速事实	`web_search` + `search.py --mode answer --intent factual`
深度调研	`web_search` + `search.py --mode deep --intent exploratory`
最新动态	`web_search(freshness="pw")` + `search.py --mode deep --intent status --freshness pw`
对比分析	`web_search` × 3 queries + `search.py --queries "A vs B" "A pros" "B pros" --intent comparison`
找资源	`web_search` + `search.py --mode fast --intent resource`