能力概述
深度研究能力让你能够系统性地调研某个主题,通过多源搜索、信息聚合、交叉验证,生成结构化的研究报告。
核心特点:
- •每个结论都标注来源引用,确保可追溯性
- •自动评估来源可信度
- •支持多维度拆解复杂主题
- •交叉验证关键数据
- •支持文档上传: 自动转换 PDF/Excel/Word 等文件为 Markdown
工作流程
Phase 0: 文档预处理(如有上传)
当用户上传文档时,优先处理:
- •检测附件类型(PDF/Excel/Word/CSV 等)
- •使用
file_converter工具转换为 Markdown - •提取关键信息并注入 Context
- •对于财报等结构化数据,自动识别关键指标
详见 L3 资源:
resources/document_upload_guide.md
Phase 1: 需求澄清
与用户确认研究主题、深度、范围:
- •主题是什么?
- •需要多深入?(概览 / 深度分析)
- •有无特定关注点?
- •输出格式偏好?
Phase 2: 查询拆解
将主题拆解为多个搜索子查询,确保覆盖:
- •概述:{topic} overview / 概述
- •市场/规模:{topic} market size / 市场规模
- •关键玩家:{topic} key players companies / 主要厂商
- •技术趋势:{topic} trends 2024 / 发展趋势
- •挑战问题:{topic} challenges problems / 面临挑战
- •案例研究:{topic} case studies / 典型案例
Phase 3: 并行搜索
对每个子查询执行 web_search:
- •每个维度至少获取 3-5 个来源
- •优先选择权威来源
- •记录搜索时间(时效性)
Phase 4: 内容提取
对搜索结果中的高相关性页面调用 read_url:
- •只读取 Top 相关性页面(避免 Context 爆炸)
- •优先官方网站、权威媒体
- •对长文本先摘要再存储
Phase 4.5: 浏览器自动化(按需)
当遇到以下情况时,切换到浏览器操作:
- •动态 SPA 应用(read_url 返回空白)
- •需要登录的平台
- •反爬虫保护的网站
- •需要滚动/交互加载的内容
浏览器工作流:
- •
browser_open打开目标页面 - •
browser_snapshot获取页面结构(compact模式) - •根据需要执行
browser_click/browser_fill - •
browser_screenshot记录关键帧 - •提取信息后
browser_close释放资源
详见 L3 资源:
resources/browser_automation.md
Phase 5: 信息聚合
- •去重相同信息
- •识别共识与分歧
- •评估来源可信度
- •整理关键数据点
Phase 6: 结构化输出
生成研究报告,标注引用
Phase 7: 用户确认
询问是否需要深入某个方向
工具使用
web_search
用途:搜索网页信息
参数:
- •
query: 搜索查询(精确、具体) - •
num_results: 结果数量(建议 5-10)
最佳实践:
- •查询要具体,避免泛泛而谈
- •多个维度分别搜索,而非一次搜全部
- •优先使用英文搜索(信息更丰富)
- •对于中文主题,中英文各搜一次
示例:
web_search(query="AI Agent market size 2024", num_results=5) web_search(query="AI Agent 市场规模 2024", num_results=5)
read_url
用途:提取网页完整内容
参数:
- •
url: 目标 URL
最佳实践:
- •只读取搜索结果中的高相关性页面
- •优先选择官方网站、权威媒体
- •对于长文本(>2000字),先摘要再存储
示例:
read_url(url="https://example.com/article")
wechat_article
用途:提取微信公众号文章内容
参数:
- •
url: 微信公众号文章链接 (mp.weixin.qq.com) - •
format: 输出格式,"markdown" (默认) 或 "html" - •
include_images: 是否包含图片引用 (默认 true)
最佳实践:
- •当用户提供微信公众号链接时,使用此工具而不是 read_url
- •微信文章通常无法通过通用爬虫抓取
- •输出为干净的 Markdown 格式
示例:
wechat_article(url="https://mp.weixin.qq.com/s/xxxxx") wechat_article(url="https://mp.weixin.qq.com/s/xxxxx", format="html")
create_document
用途:创建研究报告
参数:
- •
title: 报告标题 - •
content: Markdown 格式内容 - •
format: 输出格式(markdown)
file_converter
用途:将上传文件转换为 Markdown
参数:
- •
file_path: 文件路径(绝对或相对) - •
extract_images: 是否提取图片描述(默认 false)
支持格式:
- •办公文档: PDF, DOCX, PPTX, XLSX, XLS
- •结构化数据: CSV, JSON, XML
- •文本: TXT, MD, HTML
- •图片: JPG, PNG (需 Vision LLM)
- •压缩包: ZIP (递归处理)
示例:
file_converter(file_path="/workspace/uploads/2024Q3_财报.xlsx") file_converter(file_path="/workspace/uploads/行业报告_2024.pdf")
详见 L3 资源:
resources/document_upload_guide.md
browser_* 系列(浏览器自动化)
基于 agent-browser 的 Snapshot + Refs 机制,相比传统 Playwright 节省 93%+ tokens。
browser_open: 打开网页
browser_open(url="https://example.com")
# 返回: {"title": "...", "url": "..."}
browser_snapshot: 获取页面结构快照(核心)
browser_snapshot(interactive_only=True, compact=True) # 返回压缩的 Markdown 格式,约 500-2000 tokens # - @e1 [搜索框] type=input # - @e2 [按钮] type=button
browser_click: 点击元素
browser_click(ref="@e1") # 使用 snapshot 返回的 Ref ID
browser_fill: 填充输入框
browser_fill(ref="@e1", text="搜索关键词")
browser_screenshot: 截取关键帧
browser_screenshot(path="/workspace/screenshots/step1.png")
browser_close: 关闭浏览器
browser_close()
详细用法参见 L3 资源:
resources/browser_automation.md
最佳实践
1. Read-then-Summarize
对于长文本(>2000字):
- •先用小模型摘要
- •摘要放入 Context
- •原文存储到文件系统
2. 引用回溯
每个关键结论必须标注引用:
- •格式:
[1]、[2] - •在文末列出完整引用信息
- •引用格式:
[编号] 标题 - 来源域名 (可信度)
3. 来源可信度评分
| 来源类型 | 评分 |
|---|---|
| 官方网站/政府机构 | ★★★★★ |
| 知名媒体/研究机构 | ★★★★ |
| 专业博客/技术文档 | ★★★ |
| 社交媒体/论坛 | ★★ |
| 未知来源 | ★ |
4. 交叉验证
- •关键数据至少 2 个来源确认
- •存在分歧时明确标注
- •不同来源的数据范围要说明
5. 时效性标注
- •注明搜索日期
- •对于快速变化的领域,提醒用户数据可能过时
输出格式
# [研究主题] 深度研究报告 > 研究日期:YYYY-MM-DD > 研究深度:[概览/深度分析] ## 摘要 3-5 句话概括核心发现,包含最重要的数据点。 ## 目录 - 1. 概述 - 2. 市场规模与趋势 - 3. 主要玩家 - 4. 技术分析 - 5. 挑战与机遇 - 6. 结论与建议 ## 1. 概述 简要介绍主题背景...[1] ## 2. 市场规模与趋势 ### 2.1 市场规模 具体数据...[2][3] ### 2.2 增长趋势 分析内容...[4] ## 3. 主要玩家 | 公司 | 产品 | 特点 | |------|------|------| | ... | ... | ... | ## 4. 技术分析 技术细节...[5] ## 5. 挑战与机遇 ### 5.1 主要挑战 - 挑战1...[6] - 挑战2... ### 5.2 机遇 - 机遇1... ## 6. 结论与建议 总结性内容... --- ## 参考来源 [1] 标题 - example.com (★★★★) [2] 标题 - research.org (★★★★★) [3] 标题 - news.com (★★★★) ... ## 数据说明 - 本报告数据采集于 YYYY-MM-DD - 部分数据存在来源差异,已在文中标注 - 对于快速变化的领域,建议定期更新
注意事项
- •
避免 Context 爆炸
- •不要一次性搜索太多 query
- •长文本先摘要
- •只提取关键信息入 Context
- •
语言策略
- •优先使用英文搜索(信息更丰富)
- •对于中文主题,中英文各搜一次
- •输出语言与用户输入保持一致
- •
时效性处理
- •对于时效性强的内容,注明搜索日期
- •提醒用户数据可能变化
- •
不确定性处理
- •明确标注"据多个来源显示"/"部分来源认为"
- •存在争议时两方观点都呈现
- •避免过度断言
- •
隐私与版权
- •不搜索个人隐私信息
- •引用内容要标注来源
- •大段引用需注明"引自"