LightRAG 查询融合蒸馏管道：双图索引低资源 RAG 实现

LightRAG 作为一款低资源 RAG 框架，通过双图索引（local 实体图与 global 关系图）和查询融合机制，有效解决传统向量 RAG 在复杂实体关系捕捉上的不足。该框架无需高算力 GPU，仅依赖 CPU 友好存储如 NanoVectorDB 和 NetworkX，即可处理大规模文档，实现毫秒级响应。

核心观点在于其 “查询融合蒸馏管道”：首先通过 LLM 驱动的实体 / 关系提取与去重，形成精炼知识图；查询时提取高 / 低层关键词，分别匹配 global/local 图，进行 hybrid 融合检索；最终 LLM 基于融合上下文生成响应。这种管道设计将知识 “蒸馏” 为紧凑键值对（实体名→描述），减少 token 消耗 80% 以上，同时支持增量更新，避免全量重建。

证据支持：LightRAG 在 UltraDomain 基准（Agriculture/CS/Legal/Mix 数据集）上，综合胜率超 NaiveRAG 60%、GraphRAG 50%，尤其在 Legal 领域多样性提升 86.4%。双图索引流程为：文档分块（chunk_token_size=1200, overlap=100）→ LLM 提取三元组 → 去重合并 → 嵌入键值对（embedding_batch_num=32）。查询融合使用 QueryParam (mode="hybrid")，top_k=60（local 实体）/chunk_top_k=20（向量块），融合后 rerank（BAAI/bge-reranker-v2-m3），扩展一阶邻居捕捉高阶关系。“LightRAG 的 hybrid 模式整合知识图与向量检索，提供全面答案 [1]。”

工程落地参数清单：

索引参数：chunk_token_size=1200, overlap=100；entity_extract_max_gleaning=1；summary_context_size=10000, summary_max_tokens=500。
查询参数：mode="hybrid"/"mix"；top_k=60, max_entity_tokens=6000, max_relation_tokens=8000, max_total_tokens=30000；enable_rerank=True。
存储选择（低资源优先）：vector_storage="NanoVectorDBStorage", graph_storage="NetworkXStorage", kv_storage="JsonKVStorage"。
LLM/Embedding：llm_model_func=gpt-4o-mini_complete（索引用，避免推理模型）；embedding_func=openai_embed (bge-m3)；llm_model_max_async=4。
部署清单：
1. 安装：uv pip install lightrag-hku；cp env.example .env，配置 API_KEY。
2. 初始化：rag = LightRAG (working_dir="./rag_storage", embedding_func=..., llm_model_func=...)；await rag.initialize_storages ()。
3. 插入：rag.insert (docs, max_parallel_insert=2)；支持 PDF/DOCX 等 via textract。
4. 查询：rag.query ("复杂问题", param=QueryParam (mode="hybrid", top_k=60))。
5. 服务：lightrag-server，提供 WebUI + API + Ollama 兼容。
监控 / 回滚：启用 llm_cache；阈值 cosine_better_than_threshold=0.2；异常时 clear_cache (modes=["hybrid"])；备份 kv_store_llm_response_cache.json。

风险控制：实体提取依赖 LLM 质量，建议 entity_types=["person","organization"] 限域；图规模 >10k 节点时切换 Neo4J（export NEO4J_URI=...）；生产用 PostgreSQL 全栈（PGKV/PGVector/PGGraph）。

实际案例：在 32k token 书籍上，索引耗时 <1min（CPU），hybrid 查询响应 <2s，胜过 GraphRAG 成本 6x。该管道适用于低资源企业知识库、金融报告分析等场景，确保检索无高算力依赖。

资料来源： [1] https://github.com/HKUDS/LightRAG (README & examples) arXiv:2410.05779 "LightRAG: Simple and Fast Retrieval-Augmented Generation"

（正文约 950 字）