# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/418/
- 当前页: 418 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [拆解 Devstral 2 在 SWE-Bench 72.2% 的验证机制与 Vibe CLI 实时干预：本地代码智能体流水线落地](/posts/2025/12/10/devstral-2-swe-bench-verification-vibe-cli-local-agent-pipeline/)
- 日期: 2025-12-10T01:54:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Mistral Devstral 2 的 SWE-Bench 高分验证机制与 Vibe CLI 实时干预架构，给出本地代码智能体流水线的参数配置、监控要点与风险阈值。

### [Devstral 本地 CLI 实战：零样本函数级补丁与多文件 diff 回写参数拆解](/posts/2025/12/10/devstral-local-cli-zero-shot-function-patch-multi-file-diff/)
- 日期: 2025-12-10T01:39:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Devstral 46.8% SWE-Bench Verified 领先开源成绩，拆解本地 CLI 零样本函数级补丁生成、多文件 diff 回写工程参数与监控清单。

### [用运行时干预钩子把 LLM 的生成流在 token 级做热替换，实现可控输出修正](/posts/2025/12/10/mentat-runtime-intervention-hot-token-replace/)
- 日期: 2025-12-10T01:18:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型流式输出，给出 SSE 连接管理与断线续传的工程化参数与监控要点。

### [把 Devstral 跑在 3090：一条 CLI 工作流与四项关键参数](/posts/2025/12/10/devstral-on-rtx3090-cli-workflow-and-four-key-parameters/)
- 日期: 2025-12-10T00:48:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 官方并未发布‘Devstral 2’与 72.2% 分数，但社区已验证：单卡 RTX 3090 可无损跑通 Devstral-Small 全流程，本文给出量化下载、vLLM 起服务、OpenHands 对接与监控点清单。

### [Devstral 2 如何以 72.2% SWE-Bench 逼近 Sonnet-3.5：Agent 策略与沙盒加速参数清单](/posts/2025/12/10/devstral2-72-swe-bench-sonnet35-agent-sandbox/)
- 日期: 2025-12-10T00:33:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 假如 Devstral 2 真拿到 72.2%，它在 Agent 编排、工具调用与沙盒加速上必须落地的三项参数与两项风险控制。

### [Devstral 46.8% SWE-Bench 开源第一：本地部署与 LoRA 微调 CLI 实战](/posts/2025/12/10/devstral-local-fine-tune-cli/)
- 日期: 2025-12-10T00:25:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Devstral-Small-2505 在 SWE-Bench Verified 达 46.8%，开源领先。详解 Ollama 一键运行、vLLM 多卡部署及 Axolotl LoRA 微调全流程。

### [用 Python 绑定 cuTile：快速上手 NVIDIA GPU 高阶 Tile 原语](/posts/2025/12/10/python-cutile-bindings-quickstart-high-order-tile-primitives/)
- 日期: 2025-12-10T00:15:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 cuTile Python 绑定，掌握 GPU Tile 编程模型，从向量加法到矩阵乘的高阶原语实战参数与优化要点。

### [Epsilon：纯 Go 零依赖 WASM 虚拟机的冷启动与内存优化实践](/posts/2025/12/10/epsilon-wasm-vm-go-coldstart-memory/)
- 日期: 2025-12-10T00:03:57+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 聚焦嵌入式与 Serverless 场景，拆解 Epsilon 如何通过纯 Go 栈式解释器把冷启动压到 0.3 ms、常驻内存降到 150 KB，并给出可落地的编译标签与快照预热参数。

### [Nia 给编码智能体注入结构化上下文：用检索式知识库替代手工提示工程](/posts/2025/12/09/nia-context-for-coding-agents/)
- 日期: 2025-12-09T22:48:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型流式输出，给出 SSE 连接管理与断线续传的工程化参数与监控要点。

### [给编码代理注入“不会丢”的实时业务上下文](/posts/2025/12/09/agent-context-injection-tips/)
- 日期: 2025-12-09T22:04:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用短时记忆晋升、钩子注入、动态工具三种模式，把业务规则、字段语义、约束条件实时塞回编码 Agent，降低多轮幻觉，给出可落地的参数与防注入校验代码。

### [给编码 Agent 注入项目级上下文的可落地方案：Nia 的实时知识切片与注入机制](/posts/2025/12/09/nia-agent-context-delivery/)
- 日期: 2025-12-09T21:18:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用 Nia 的三件套（监听→切片→注入）让编码 Agent 获得秒级更新的项目脑，附双阈值语义折叠算法与 Token 经济学参数。

### [用 cuTile Python 写 GPU 并行 kernel：像 NumPy 广播一样简洁却跑满 Tensor Core](/posts/2025/12/09/cutile-python-gpu-kernel-like-numpy-broadcast/)
- 日期: 2025-12-09T20:09:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 CUDA 13.1 的 cuTile Python，15 行代码即可写出打满 Tensor Core 的 GPU kernel，并给出 Tile 尺寸、dtype、occupancy 等可直接落地的调优参数。

### [给编码智能体注入更细粒度的仓库级上下文，提升多文件补全与重构准确率](/posts/2025/12/09/injecting-granular-repo-context-into-coding-agents/)
- 日期: 2025-12-09T19:49:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析 JetBrains Junie 如何通过 RAG+MCP 把‘行级补全’升级为‘仓库级任务’，并给出 2 min 级多文件接口生成的落地参数与回滚策略。

### [用可检索上下文注入让编码 Agent 实现跨文件精准补全与重构](/posts/2025/12/09/agent-retrievable-context-injection/)
- 日期: 2025-12-09T19:33:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将代码上下文外包给检索系统，按需注入 Agent，兼顾 token 成本与跨文件准确率，给出三段阈值与回滚策略。

### [给编码 Agent 注入可验证的代码上下文，减少幻觉并支持多步重构](/posts/2025/12/09/inject-verifiable-context-into-coding-agent/)
- 日期: 2025-12-09T19:06:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Agent Planning 阶段插入 Verifiable Context Provider，输出影响图、变更契约与校验桩，让每一步 diff 先验证后落地，实现仓库级多步重构不断链。

### [编码 Agent 代码库级上下文注入：三层架构与检索压缩策略](/posts/2025/12/09/codebase-context-injection-for-coding-agents/)
- 日期: 2025-12-09T18:54:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Coding Agent在大型代码库中的上下文缺失，给出显式/动态/隐式三层注入架构，检索重排压缩策略，以及15分钟落地清单。实测SWE-bench通过率↑12%，任务时长减半。

### [用 Nia 的「对话-代码混合上下文」把编码代理的窗口利用率拉满，避免 token 浪费与幻觉](/posts/2025/12/09/nia-mixed-context-for-agent/)
- 日期: 2025-12-09T18:34:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 对话与代码异构信息共存时，Agent 窗口极易爆仓。Nia 通过分治+融合、双级压缩与阈值触发，把长任务 token 成本砍半，幻觉率下降 40%。

### [用 Jepsen 验证 NATS JetStream 线性一致性：可复现的测试模型与调参经验](/posts/2025/12/09/jepsen-nats-linearizability/)
- 日期: 2025-12-09T18:21:03+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 NATS 2.12.1 与 Jepsen 框架，给出验证 JetStream 线性一致性的完整工程流程、模型选择、参数调优与故障注入 checklist。

### [给编码 Agent 注入结构化上下文：Nia 的仓库级记忆方案与落地模板](/posts/2025/12/09/structured-context-injection-for-coding-agent/)
- 日期: 2025-12-09T18:05:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 把仓库级长期记忆拆成静态结构化上下文与动态状态两段注入，让大模型在单轮 200k token 内既看得远又踩得准，附可复制模板与阈值。

### [用 Jepsen 框架对 NATS 2.12.1 做线性一致性压测：暴露消息丢失与重放细节并给出可复现的故障注入脚本](/posts/2025/12/09/jepsen-nats-linearizability-audit/)
- 日期: 2025-12-09T17:48:48+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 JetStream 的 exactly-once 机制，给出可复现的 Jepsen 故障注入脚本与调参清单，帮助你在 2.12.1 版本上快速验证线性一致性边界。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
