LightRAG 中无嵌入双图 RAG：实体关系链接与递归查询实现

LightRAG 作为一种简洁高效的检索增强生成（RAG）框架，其核心创新在于引入双图（dual-graph）机制，利用实体 - 关系链接实现无嵌入依赖的快速检索。这种方法避免了传统向量嵌入的计算开销，通过图结构直接捕捉文档间的语义关联，实现可扩展的知识表示和查询优化。相比依赖嵌入的传统 RAG，LightRAG 的双图 RAG 在处理复杂、多跳关系查询时表现出色，尤其适合大规模动态知识库场景。

双图 RAG 的观点在于，将知识图谱分为实体层（local level）和关系层（global level），前者聚焦具体实体上下文，后者通过关系遍历扩展全局洞见。这种设计的核心是实体 - 关系提取，使用 LLM 零样本提示直接从文本中抽取节点和边，形成图谱，而非依赖嵌入向量进行相似度匹配。这不仅降低了存储和计算成本，还提升了检索的精确性和速度。在 LightRAG 中，实体提取通过精心设计的提示词完成，例如指定实体类型如 “person”、“organization”、“location”，并输出结构化格式如 (“entity”{delimiter}“名称”{delimiter}“类型”{delimiter}“描述”)。关系提取类似，捕捉如 “属于” 或 “位于” 等连接。证据显示，这种无嵌入方法在索引阶段仅需一次 LLM 调用 per chunk，远低于 GraphRAG 的多轮社区聚类。

进一步证据来自 LightRAG 的检索流程。在 local 模式下，系统使用向量数据库匹配查询关键词与实体描述，但核心依赖图邻接而非纯嵌入相似度；在 global 模式下，通过递归查询扩展一跳或多跳邻居，实现关系链的自动遍历。例如，对于查询 “气候变化对蜜蜂的影响”，local 检索锁定 “蜜蜂” 实体，global 则递归扩展至 “气候变化”→“栖息地破坏”→“蜜蜂种群下降” 的关系路径。这种递归机制类似于图遍历算法，避免了全图嵌入的瓶颈，支持零样本效率 —— 无需微调 LLM，仅靠提示工程即可适应新领域。实验结果表明，在农业、法律等数据集上，LightRAG 的全面性得分达 67.6%，多样性 76.4%，显著优于 Naive RAG 的 32.4% 和 23.6%。

为实现可落地的双图 RAG，需关注关键参数配置。首先，文档分块参数：chunk_token_size=1200，chunk_overlap_token_size=100，使用 Tiktoken 分词器（tiktoken_model_name='gpt-4o-mini'），确保每个块不超过 LLM 上下文限制。其次，提取参数：entity_extract_max_gleaning=1（单轮提取避免冗余），summary_max_tokens=500（实体 / 关系描述长度），addon_params={'entity_types': ['person', 'organization', 'location', 'event']} 指定领域实体。图存储选择：默认 NetworkXStorage 适合小规模，生产环境推荐 Neo4JStorage（配置 NEO4J_URI、USERNAME、PASSWORD），支持高效遍历。检索参数：QueryParam 中 top_k=60（实体 / 关系上限），chunk_top_k=20（文本块重排后保留），mode='hybrid' 结合 local/global，enable_rerank=True（使用 BAAI/bge-reranker-v2-m3 提升相关性）。为零样本效率，llm_model_func 使用 gpt-4o-mini_complete，embedding_func 可选 openai_embed 但在纯图模式下最小化使用（embedding_batch_num=32）。

落地清单如下：1. 初始化：创建 LightRAG 实例，指定 working_dir='./rag_storage'，graph_storage='Neo4JStorage'，调用 await rag.initialize_storages () 和 await initialize_pipeline_status ()。2. 插入数据：rag.insert ([' 文档 1', ' 文档 2'])，支持批量（max_parallel_insert=4），可选 ids 和 file_paths 用于引用追踪；对于增量更新，直接 insert 新文档，系统自动 union 到现有图。3. 查询执行：使用 rag.query (' 查询文本 ', param=QueryParam (mode='hybrid', top_k=60, stream=True))，conversation_history 维护上下文；对于递归深度，监控 max_entity_tokens=6000 和 max_relation_tokens=8000 控制令牌预算。4. 监控与优化：启用 enable_llm_cache=True 缓存提示响应，TokenTracker 追踪使用（with token_tracker: rag.query (...)），定期 clear_cache (modes=['global']) 清理旧缓存；风险点包括 LLM 提取噪声，使用 enable_llm_cache_for_entity_extract=True 调试。5. 回滚策略：若图不一致，adelete_by_doc_id ('doc_id') 重建受影响部分，避免全清；生产中集成 Langfuse 观测 LLM 调用，设置 cosine_better_than_threshold=0.2 过滤低相似向量。

这种无嵌入双图 RAG 的优势在于简洁性和速度，适用于资源受限环境。通过实体 - 关系链接和递归查询，LightRAG 实现了高效的知识聚合，支持零样本部署。实际应用中，结合自定义 KG insert_custom_kg () 可注入领域知识，进一步提升精度。

资料来源：LightRAG GitHub 仓库（https://github.com/HKUDS/LightRAG），arXiv 论文（https://arxiv.org/abs/2410.05779）。