LangChain.js 中模块化 LLM 链：结合 RAG 和工具调用构建可扩展 AI 代理

在 Node.js 环境中构建可扩展的 AI 代理时，LangChain.js 提供了一种高效的模块化方法，通过检索增强生成 (RAG) 和工具调用来实现上下文感知推理。这种方法的核心在于将 LLM 链式组合成可复用的组件，避免从零构建复杂逻辑，从而提升开发效率和系统鲁棒性。RAG 确保代理能从外部知识源中检索相关信息，而工具调用则赋予代理执行具体操作的能力，如查询数据库或进行计算，形成一个完整的推理闭环。

首先，理解 RAG 在 LangChain.js 中的作用。RAG 解决了 LLM 幻觉问题，通过将用户查询与检索到的文档结合，提供更准确的响应。实现 RAG 需要两个主要阶段：索引和检索生成。索引阶段涉及加载文档、文本分割和向量存储。在代码中，使用 CheerioWebBaseLoader 加载网页内容，然后应用 RecursiveCharacterTextSplitter 分割文档。

例如，假设我们构建一个基于博客内容的问答代理。加载文档后，分割成 chunkSize 为 1000、chunkOverlap 为 200 的片段，这能平衡检索精度和上下文完整性。随后，使用 OpenAIEmbeddings 生成嵌入，并存入 MemoryVectorStore（适用于开发阶段；生产中推荐 Pinecone 或 Chroma 以支持大规模数据）。这一步的证据在于，LangChain.js 文档强调向量存储的相似性搜索能有效召回相关 chunks，提高生成质量。

检索生成阶段使用 LangGraph 编排工作流。定义状态包括 question、context 和 answer。检索节点调用 vectorStore.similaritySearch 获取 top-k（建议 k=4）文档，生成节点则将检索上下文注入提示模板，如 “使用以下上下文回答问题：{context} 问题：{question}”。绑定 ChatGroq 或 ChatOpenAI 模型（temperature=0 以确保确定性输出），通过 prompt | model | outputParser 的 LCEL 链式组合执行。实际测试显示，这种配置在处理如 “什么是任务分解？” 的查询时，能从 Lilian Weng 的代理博客中精确提取定义，避免 LLM 凭空捏造。

为了增强代理的上下文感知能力，引入工具调用。工具调用允许 LLM 决定何时调用外部函数，如数学计算或 API 查询。在 LangChain.js 中，使用 @langchain/core/tools 的 tool 装饰器定义工具，例如一个乘法工具：

const multiplyTool = tool ((input) => input.a * input.b, { name: 'multiply', description: ' 计算两个数字的乘积 ', schema: z.object ({ a: z.number ().describe (' 第一个数字 '), b: z.number ().describe (' 第二个数字 ') }) });

然后，通过 model.bindTools ([multiplyTool]) 绑定到模型。LangGraph 的工具节点（ToolNode）处理调用，条件边（toolsCondition）检查响应中是否有 tool_calls，若有则路由到工具执行，否则结束。

构建 agent 时，使用 StateGraph 定义节点：agent（模型决策）和 tools（执行）。例如，对于多步计算如 “3 乘 4 乘 5”，代理先调用 multiply (3,4)=12，然后 multiply (12,5)=60。这种循环推理体现了上下文感知的核心：代理维护状态，逐步积累结果。证据来自 LangChain.js 的 agents 概念，强调工具调用支持多模态输入和错误恢复。

可落地参数和清单是工程化关键。首先，RAG 参数：chunkSize=1000（过大导致无关噪声，过小丢失上下文）；overlap=200（20% 重叠避免边界信息丢失）；embedding 模型选 text-embedding-3-small 以降低成本（维度 1536，适合 Node.js 内存）。检索时，set k=3-5，结合 MMR（最大边际相关性）多样化结果，阈值 >0.7 过滤低相似度 chunks。

工具调用清单：1. 定义 schema 时，使用 z.object 确保类型安全，添加 describe 提升 LLM 理解；2. 绑定工具后，设置 maxIterations=5 防止无限循环；3. 错误处理：工具抛异常时，回滚到纯 LLM 生成，并日志记录；4. 监控：集成 LangSmith 追踪 token 使用（目标 <4000 / 调用）和工具调用率（>80% 准确率）。

对于可扩展性，模块化链的优势在于复用：RAG 链可作为工具注入 agent，agent 链可嵌入更大系统。生产部署时，使用 Vercel Edge Functions 支持无服务器执行，结合 Redis 持久化状态。风险包括工具延迟（<2s / 调用）和隐私泄露（避免敏感工具），通过回滚策略和访问控制缓解。

总之，在 LangChain.js 中，RAG 和工具调用的结合构建了高效的上下文感知代理。开发者可从简单链起步，逐步扩展到复杂工作流，确保系统在 Node.js 环境中 scalable 和 maintainable。通过上述参数和清单，快速落地生产级应用，提升 AI 代理的实用价值。

（字数：1025）