LightRAG 作为一款低资源 RAG 框架,通过双图索引(local 实体图与 global 关系图)和查询融合机制,有效解决传统向量 RAG 在复杂实体关系捕捉上的不足。该框架无需高算力 GPU,仅依赖 CPU 友好存储如 NanoVectorDB 和 NetworkX,即可处理大规模文档,实现毫秒级响应。
核心观点在于其 “查询融合蒸馏管道”:首先通过 LLM 驱动的实体 / 关系提取与去重,形成精炼知识图;查询时提取高 / 低层关键词,分别匹配 global/local 图,进行 hybrid 融合检索;最终 LLM 基于融合上下文生成响应。这种管道设计将知识 “蒸馏” 为紧凑键值对(实体名→描述),减少 token 消耗 80% 以上,同时支持增量更新,避免全量重建。
证据支持:LightRAG 在 UltraDomain 基准(Agriculture/CS/Legal/Mix 数据集)上,综合胜率超 NaiveRAG 60%、GraphRAG 50%,尤其在 Legal 领域多样性提升 86.4%。双图索引流程为:文档分块(chunk_token_size=1200, overlap=100)→ LLM 提取三元组 → 去重合并 → 嵌入键值对(embedding_batch_num=32)。查询融合使用 QueryParam (mode="hybrid"),top_k=60(local 实体)/chunk_top_k=20(向量块),融合后 rerank(BAAI/bge-reranker-v2-m3),扩展一阶邻居捕捉高阶关系。“LightRAG 的 hybrid 模式整合知识图与向量检索,提供全面答案 [1]。”
工程落地参数清单:
- 索引参数:chunk_token_size=1200, overlap=100;entity_extract_max_gleaning=1;summary_context_size=10000, summary_max_tokens=500。
- 查询参数:mode="hybrid"/"mix";top_k=60, max_entity_tokens=6000, max_relation_tokens=8000, max_total_tokens=30000;enable_rerank=True。
- 存储选择(低资源优先):vector_storage="NanoVectorDBStorage", graph_storage="NetworkXStorage", kv_storage="JsonKVStorage"。
- LLM/Embedding:llm_model_func=gpt-4o-mini_complete(索引用,避免推理模型);embedding_func=openai_embed (bge-m3);llm_model_max_async=4。
- 部署清单:
- 安装:uv pip install lightrag-hku;cp env.example .env,配置 API_KEY。
- 初始化:rag = LightRAG (working_dir="./rag_storage", embedding_func=..., llm_model_func=...);await rag.initialize_storages ()。
- 插入:rag.insert (docs, max_parallel_insert=2);支持 PDF/DOCX 等 via textract。
- 查询:rag.query ("复杂问题", param=QueryParam (mode="hybrid", top_k=60))。
- 服务:lightrag-server,提供 WebUI + API + Ollama 兼容。
- 监控 / 回滚:启用 llm_cache;阈值 cosine_better_than_threshold=0.2;异常时 clear_cache (modes=["hybrid"]);备份 kv_store_llm_response_cache.json。
风险控制:实体提取依赖 LLM 质量,建议 entity_types=["person","organization"] 限域;图规模 >10k 节点时切换 Neo4J(export NEO4J_URI=...);生产用 PostgreSQL 全栈(PGKV/PGVector/PGGraph)。
实际案例:在 32k token 书籍上,索引耗时 <1min(CPU),hybrid 查询响应 <2s,胜过 GraphRAG 成本 6x。该管道适用于低资源企业知识库、金融报告分析等场景,确保检索无高算力依赖。
资料来源: [1] https://github.com/HKUDS/LightRAG (README & examples) arXiv:2410.05779 "LightRAG: Simple and Fast Retrieval-Augmented Generation"
(正文约 950 字)