# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/417/
- 当前页: 417 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [拆解 Devstral 在 SWE-Bench 53.6% 背后的工程实践：微调数据配比、沙盒执行与反馈采样](/posts/2025/12/10/devstral-swe-bench-fine-tune-data-ratio-sandbox-feedback-sampling/)
- 日期: 2025-12-10T08:39:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 Mistral Devstral Small 1.1 的 53.6% SWE-Bench Verified 分数出发，工程化拆解微调数据 70% 合成+30% 真实、非基准污染源、OpenHands 沙盒配置与 RL 反馈采样策略，提供可复制参数与监控清单。

### [把 Devstral 推向 72%：模型、测试时推理与沙盒协同的六条可落地参数](/posts/2025/12/10/devstral-72-percent-swe-bench-parameter-blueprint/)
- 日期: 2025-12-10T08:18:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Devstral 现有架构，给出将 SWE-Bench Verified 成绩从 61.6% 提升到 72% 量级的六组可直接写入配置表的参数与监控阈值。

### [复现 Devstral 2 训练-评估链路：函数级补丁生成与多回合推理策略](/posts/2025/12/10/reproduce-devstral2-training-evaluation-pipeline/)
- 日期: 2025-12-10T08:03:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在官方细节缺席的情况下，用可落地参数与监控点拼出 123B 模型 SWE-Bench 72.2% 的复现蓝图。

### [用运行时干预机制在推理阶段精准控制 LLM 行为，避免重训即可修正偏差与幻觉](/posts/2025/12/10/runtime-intervention-llm-inference-control/)
- 日期: 2025-12-10T07:33:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 熵触发、条件激活、进度向量三大路线，让推理 LLM 在生成阶段即可被‘微操作’，无需重训即可修正幻觉与偏差，并给出可直接落地的参数清单与风险应对方案。

### [Devstral 以 61.6% SWE-Bench Verified 刷新开源模型极限，可深挖其测试集过滤与工具调用优化细节](/posts/2025/12/10/devstral-61-percent-swe-bench-verified-open-source-limit/)
- 日期: 2025-12-10T07:05:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 Devstral Medium 2507 的 61.6% 得分出发，拆解 Mistral 在测试集过滤、工具调用与长上下文推理上的三件秘密武器，并给出可落地的本地复现参数与监控清单。

### [拆解 Mistral Devstral：24B 参数拿下 SWE-Bench Verified 46.8% 的三件套工程](/posts/2025/12/10/devstral-swe-bench-verified-46-percent/)
- 日期: 2025-12-10T06:33:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 数据合成、强化学习奖励函数与沙盒执行回环如何协力把 24B 模型推到开源榜首，并给出可复现的本地化训练脚本。

### [从 46.8% 到 72.2%：Devstral 2 的代理微调与测试集过滤工程](/posts/2025/12/10/devstral2-swebench-verified-72-percent-agent-fine-tune/)
- 日期: 2025-12-10T06:18:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Mistral Devstral 2 如何把 SWE-Bench Verified 刷到 72% 量级：数据去污染、强化学习脚手架与三阶段评测流水线。

### [拆解 Mistral Devstral2 的 72.2% SWE-Bench 流水线与测试过滤策略](/posts/2025/12/10/devstral2-swebench-72-percent-pipeline/)
- 日期: 2025-12-10T06:03:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在假设 72.2% 得分成立的前提下，用公开案例反推 Devstral2 可能采用的三阶段代码修复流水线、双层测试过滤器与可落地超参数。

### [Devstral 2 72.2% SWE-Bench 验证背后的 Agent 代码合成与运行时干预机制拆解](/posts/2025/12/10/devstral-2-swe-bench-agent-intervention/)
- 日期: 2025-12-10T05:48:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 46.8% 到 72.2% 的跃升并非魔法，而是把 Agent、框架与 CLI 工具链拧成一股绳：本文给出可复制的运行时干预参数与监控清单。

### [拆解 Mistral Devstral 在 SWE-Bench 46.8% 成绩背后的 agentic 代码修复流程与工具链集成要点](/posts/2025/12/10/mistral-devstral-swebench-agentic-code-repair/)
- 日期: 2025-12-10T05:33:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从环境感知到沙箱回归，逐层拆解 Devstral 的 agentic 代码修复闭环，并给出 RTX 4090 本地部署与 OpenHands 框架集成清单。

### [Devstral 2 的 72.2% SWE-Bench 背后：流式代码生成与运行时沙箱拆解](/posts/2025/12/10/devstral-2-swe-bench-streaming-sandbox/)
- 日期: 2025-12-10T05:03:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 以 Devstral 46.8% 开源 SOTA 为锚点，拆解其如何借助 OpenHands 沙箱与流式生成在真实 GitHub 问题上实现高效修复，并给出本地部署与参数调优清单。

### [Devstral 2 刷新开源代码修复纪录：72.2% SWE-Bench 背后的数据筛选与后训练策略](/posts/2025/12/10/devstral-2-swebench-record/)
- 日期: 2025-12-10T04:18:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 以 72.2% SWE-Bench Verified 拿下开源榜首的 Devstral 2，只用 24B 参数就超越 670B 巨兽。本文拆解其真实 GitHub Issue 数据筛选、Small 3.1 轻量微调与强化学习后训练配方，给出可落地的私有化部署参数与 IDE 集成要点。

### [拆解微软 VibeVoice 的 Frontier Voice AI 架构：低延迟流式多语言语音合成实践](/posts/2025/12/10/vibevoice-frontier-voice-ai-low-latency-streaming-tts/)
- 日期: 2025-12-10T04:07:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 7.5 Hz 声学 Tokenizer 到交错窗口，还原 300 ms 首包语音的实现细节与可落地参数。

### [Devstral 2 与 Vibe CLI：本地化大模型如何一句 vibe 出可合并 PR](/posts/2025/12/10/devstral-2-vibe-cli-local-llm-mergeable-pr/)
- 日期: 2025-12-10T03:54:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Mistral 新发布的 Devstral 2（72.2% SWE-Bench）与 Vibe CLI，看本地化大模型如何端到端 vibe 出可合并 PR。

### [拆解 Devstral 的 SWE-Bench 冠军回路：补丁级生成与测试回环加速](/posts/2025/12/10/devstral-swe-bench-champion-loop/)
- 日期: 2025-12-10T03:27:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源代理框架，Devstral 以 46.8% 拿下 SWE-Bench Verified 第一，其补丁生成与测试反馈回路的关键参数与优化策略。

### [拆解 Mistral Devstral 2 的 SWE-Bench 微调配方：数据构造、强化学习奖励与推理时 patch 验证流水线](/posts/2025/12/10/mistral-devstral2-swe-bench-recipe/)
- 日期: 2025-12-10T03:03:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在现有 46.8% 成绩基础上，按 Mistral 披露的三段式配方继续放大，推导出迈向 72.2% 的关键阈值与可落地参数清单。

### [Devstral 2 如何冲击 72.2%：自研沙盒、并行验证与失败回放](/posts/2025/12/10/devstral2-72-percent-swe-bench-verified/)
- 日期: 2025-12-10T02:33:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 以 46.8% 为起点，拆解 Mistral 若要再提 25 个百分点可落地的评估工程化框架与参数。

### [Devstral 2 如何在 RTX 3090 上蒸馏出高 pass@1 的代码修复小模型](/posts/2025/12/10/devstral-2-distill-high-pass1-on-rtx3090/)
- 日期: 2025-12-10T02:19:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 46.8% SWE-Bench Verified 的 Devstral，给出单卡 RTX 3090 蒸馏到 7B、pass@1 提升至 55% 的完整工程参数与监控方案。

### [cuTile Python：轻量级 DSL 加速 PyTorch 算子 3-5 倍](/posts/2025/12/10/cu-tile-python-tiled-kernel-dsl/)
- 日期: 2025-12-10T02:15:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: cuTile 用几行 Python DSL 表达 GPU 分块与共享内存优化，实现 PyTorch 自定义算子 3-5 倍提速的关键参数与融合实践。

### [Devstral 2 以 72.2% SWE-Bench Verified 刷新开源上限：训练数据配比与后训练策略复盘](/posts/2025/12/10/devstral-2-swe-bench-72-percent-training-data-post-training/)
- 日期: 2025-12-10T02:10:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Devstral 2 如何通过 80/20 真实+合成数据配比与 RL+DPO 后训练策略，实现开源模型 SWE-Bench Verified 72.2% 历史新高，提供微调参数清单与部署监控要点。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)