系统化测试生成:如何自动捕获 Anthropic 的 top-K 采样 bug针对 LLM 推理中的 top-K 采样 bug,探讨基于分数证明分解的系统化测试生成框架,提供可落地的参数配置与监控策略。2026-01-14ai-systems-testing2026-01