功能
RAG 多路检索服务,提供:
- •向量语义检索 - 基于 Milvus 的向量相似度搜索
- •Rerank 重排序 - 对检索结果进行精排
- •文档存储 - 保存文档到向量数据库
调用方式
python
from services.rag_service.client import RAGServiceClient
client = RAGServiceClient()
# 健康检查
status = client.health()
# 语义检索
result = client.retrieve(
query="Python 异步编程最佳实践",
top_k=5,
min_score=0.85,
rerank=True
)
print(result["results"])
# 便捷方法:只获取文本列表
texts = client.retrieve_texts(query="Python 异步编程", top_k=5)
# 保存文档
client.save(documents=[
{"text": "文档内容...", "metadata": {"title": "标题", "url": "..."}}
])
返回格式
retrieve
json
{
"query": "Python 异步编程",
"results": [
{
"id": "abc123",
"text": "Python异步编程基于asyncio库...",
"score": 0.92,
"metadata": {"title": "Python官方文档", "url": "..."}
}
],
"total": 3,
"elapsed_ms": 45.2,
"from_cache": false
}
save
json
{
"saved_count": 5,
"collection_name": "websearch_results"
}