Claude API 严格模式下工具调用的 JSON Schema 强制执行

在构建多步 AI 代理时，确保工具调用的输出严格符合预定义的 JSON Schema 是生产环境中的关键需求。Claude API 的严格模式（strict mode）通过约束解码机制，强制模型生成的工具输入参数完全匹配 schema 定义，避免类型不匹配、缺失字段或无效格式，从而显著降低解析错误和重试开销。这种方法特别适用于复杂工作流，如自动化数据提取、外部 API 集成或代理链式调用场景，其中任何 schema 违规都可能导致下游系统故障。

严格模式的实现依赖于 Anthropic 的 Structured Outputs 功能。具体而言，在 Messages API 的工具定义中添加 "strict": true 参数，即可启用该模式。工具定义包括 name、description 和 input_schema，后者采用 JSON Schema 标准描述参数结构。例如，一个查询天气的工具可能定义为：{"type": "object", "properties": {"location": {"type": "string", "description": "城市名称"}, "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}}, "required": ["location"], "additionalProperties": false}，并在 function 对象中设置 "strict": true。Claude 在生成工具调用时，会通过受限采样确保 input 字段如 location 为字符串类型，且 unit 仅限于 enum 值，否则模型将无法生成违规输出。根据官方文档，这种约束解码保证了 100% 的 schema 合规性，尤其在 Claude 3.5 Sonnet 等模型上表现稳定。

证据显示，启用严格模式后，工具调用的可靠性大幅提升。在传统工具调用中，Claude 可能推断缺失参数或使用不兼容类型（如将整数解析为字符串），导致约 10-20% 的调用失败率。而在严格模式下，这些问题被根除：模型拒绝生成无效输入，转而等待更多上下文或直接拒绝调用。Anthropic 的测试表明，在多工具并行调用场景中，严格模式将错误率从 15% 降至 0%，特别适合代理系统，其中一个工具的失败可能级联影响整个链条。例如，在一个电商代理中，严格模式确保库存查询工具的 product_id 参数始终为整数，避免了数据库查询崩溃。

为了在生产中落地严格模式，需要设计验证管道和监控机制。首先，schema 设计应遵循支持的限制：仅使用基本类型（object, array, string 等）、enum、required 和 additionalProperties: false；避免不支持的特征如递归定义或 minLength 约束，否则将触发 400 错误。推荐参数包括：max_tokens 设置为 1024-2048 以容纳复杂 schema；tool_choice: {"type": "auto"} 以允许模型自主决定调用；并在 SDK（如 Python 的 anthropic 库）中使用 transform_schema () 辅助转换 Pydantic 模型为兼容 schema，同时保留原约束进行后验验证。

可落地清单如下：

Schema 准备：使用 Pydantic/Zod 定义模型，转换后添加 "strict": true。阈值：属性数 ≤ 10，嵌套深度 ≤ 3，避免复杂 enum（>5 项）。
API 调用集成：在 messages.create () 中传入 tools 数组，启用 betas=["structured-outputs-2025-11-13"]。监控点：响应 stop_reason 为 "tool_use" 时，提取 input 并用 jsonschema.validate () 二次校验（尽管严格模式已保证）。
错误处理管道：捕获 refusal (stop_reason: "refusal") 或 max_tokens 情况，回滚至非严格模式重试。参数：重试阈值 3 次，超时 30s；日志记录 schema 违规尝试。
性能优化：首次请求有 grammar 编译延迟（~200ms），后续缓存 24 小时。监控：输入 token 增加 346（Sonnet 模型），预算中预留 20% 额外 token。
测试与回滚：单元测试覆盖 80% 场景，如缺失 required 字段时模型应询问用户。回滚策略：若严格模式导致拒绝率 >5%，切换 tool_choice: {"type": "any"} 并添加提示工程鼓励 schema 遵守。

在多步代理中，结合严格模式与并行工具调用（parallel tool use）可进一步提升效率：Claude 可同时调用多个工具，所有 input 均经 schema 验证，返回时在单一 user 消息中提供 tool_result 块。实际部署中，建议从简单工具起步，逐步扩展到代理链，确保每个步骤的输出作为下一个输入时类型一致。

最后，引用官方文档："Add strict: true to your tool definitions to ensure Claude’s tool calls always match your schema exactly—no more type mismatches or missing fields." 此机制不仅减少了生产工作流的错误，还为 AI 系统提供了更 robust 的基础架构。

资料来源：Anthropic Claude API 文档（https://docs.anthropic.com/en/docs/build-with-claude/structured-outputs），2025 年 11 月更新。