# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/416/
- 当前页: 416 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [Devstral2 本地 CLI 流式调用：零依赖构建多 Agent 编排沙箱](/posts/2025/12/10/devstral2-local-cli-streaming/)
- 日期: 2025-12-10T14:24:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用 Mistral Vibe CLI 把 Devstral2 跑在本地，三分钟搭出隔离沙箱，让多 Agent 在 Git 快照里安全试错。

### [VibeVoice 流式推理本地部署优化：300 ms 首帧与 GPU 量化实践](/posts/2025/12/10/vibevoice-streaming-inference-local-deploy/)
- 日期: 2025-12-10T14:14:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于微软 VibeVoice Realtime 模型，详解消费级 GPU 本地部署实践，包括混合量化、FlashAttention 编译与流式预热参数。

### [Devstral2 + Vibe CLI：本地多文件上下文流式生成可执行代码与 MCP 原型实战](/posts/2025/12/10/devstral2-vibe-cli-local-mcp-prototype/)
- 日期: 2025-12-10T14:03:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借助 Mistral 最新 123B 代码模型与 Vibe CLI，把本地仓库一把塞进上下文，流式输出可执行脚本，30 分钟搭出 MCP/Agent 可交互原型。

### [拆解 Devstral2 与 Mistral Vibe CLI 的流式补全协议与本地 Guardrails 实现](/posts/2025/12/10/devstral2-vibe-cli-streaming-protocol-local-guardrails/)
- 日期: 2025-12-10T12:49:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型流式输出，给出 SSE 连接管理与断线续传的工程化参数与监控要点。

### [拆解 Devstral2 与 Vibe CLI 的本地工具链：模型蒸馏、函数调用与终端即服务的一体化设计](/posts/2025/12/10/devstral2-vibe-cli-local-toolchain/)
- 日期: 2025-12-10T12:18:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 1230 亿旗舰到 24 亿本地蒸馏，再看 Mistral Vibe CLI 如何把自然语言直接编译成 Git 记录，一份可落地的参数清单与商业授权红线提醒。

### [用 cuTile Python 把 GPU 内核写成可组合的高维 tile：15 行代码实现 200 行 CUDA C++ 性能](/posts/2025/12/10/cuda-tile-python-algorithmic-portability/)
- 日期: 2025-12-10T12:07:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: cuTile Python 通过 tile 级抽象把并行核函数压缩成 NumPy 风格代码，自动映射到 Tensor Core，跨 Blackwell 与未来架构免重写。

### [Devstral2 与 Vibe CLI：本地零配置氛围编程完整链路拆解](/posts/2025/12/10/devstral2-vibe-cli-zero-config/)
- 日期: 2025-12-10T12:03:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 123B 旗舰到 24B 本地单卡，Mistral 用 Devstral2 系列模型 + Vibe CLI 把 vibe coding 做成开箱即用的工程产品，10 分钟跑完代码生成-调试-回滚闭环。

### [Devstral2 + Vibe CLI：把“氛围编程”搬进终端的流式补全实战](/posts/2025/12/10/devstral2-vibe-cli-streaming-completion-local-toolchain/)
- 日期: 2025-12-10T11:50:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Devstral2 系列模型与 Mistral Vibe CLI，在本地单卡环境实现 256 K 长上下文流式补全，并给出可复制的 Docker-Ollama 一键脚本与显存调优参数。

### [用 Devstral2 打造 Vibe CLI：本地 C 项目流式 vibe-coding 模板](/posts/2025/12/10/devstral2-vibe-cli-streaming-template/)
- 日期: 2025-12-10T11:25:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Devstral2 流式推理管线，提供最小 C CLI 与 Makefile 模板，将任意本地 C 项目秒变 vibe-coding 工程化模板。含参数阈值、风险监控。

### [用 Devstral2 与 Vibe CLI 实现本地 C/C++ 多文件流式 AI 编码：零配置参数与回滚清单](/posts/2025/12/10/devstral2-vibe-cli-zero-config-cpp-streaming/)
- 日期: 2025-12-10T11:07:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Mistral 新发布的 Devstral2 模型与 Vibe CLI，看本地多文件上下文怎样零配置驱动 C/C++ 项目的 AI 编码流，并给出可直接落地的窗口、分片、缓存与回滚参数。

### [用 Devstral2 与 Mistral Vibe CLI 在本地把自然语言需求直接编译为可执行代码并自动跑通测试，实现零配置 LLM 原生开发闭环](/posts/2025/12/10/devstral2-mistral-vibe-cli-zero-config-local-llm-dev-loop/)
- 日期: 2025-12-10T10:33:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 一条命令安装、一句话需求、一分钟出包并跑通测试：Devstral2 + Vibe CLI 的本地 LLM 原生开发闭环最小实践与参数清单。

### [Devstral2 与 Mistral Vibe CLI 的流式补全与本地工具链集成实践](/posts/2025/12/10/devstral2-vibe-cli-streaming-local-toolchain/)
- 日期: 2025-12-10T10:24:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Devstral2 代码模型结合 Vibe CLI，实现本地流式补全的高效工程实践，包括 vLLM 部署参数、SSE 续传机制与工具集成要点。

### [用 cuTile Python DSL 编写可移植的 GPU 并行内核，一行代码切换 tile-size 与数据布局](/posts/2025/12/10/nvidia-cutile-python-dsl-portable-gpu-kernel/)
- 日期: 2025-12-10T10:08:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型流式输出，给出 SSE 连接管理与断线续传的工程化参数与监控要点。

### [Gemini Pro 3 幻觉预测十年后的 HN 首页：极限测试揭示模型天花板](/posts/2025/12/10/gemini-pro-3-hallucination-hacker-news-prediction/)
- 日期: 2025-12-10T10:06:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用‘预测 2035 年 Hacker News 头条’当极限测试，验证 Gemini Pro 3 的幻觉边界，并给出零成本可落地的幻觉观测三步法。

### [Linux内核Rust实验"终止"的真相：从实验到正式的技术演进](/posts/2025/12/10/linux-kernel-rust-experiment-transition-analysis/)
- 日期: 2025-12-10T10:06:55+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 分析Linux内核Rust支持从实验性到正式化的转变过程，探讨内存安全与性能的技术权衡、ABI兼容性挑战及未来发展方向。

### [Devstral2 小模型 + Vibe CLI 的本地流式补全与断线续传实现细节](/posts/2025/12/10/devstral2-vibe-cli-streaming-resilience/)
- 日期: 2025-12-10T10:03:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Devstral Small 24B 与 Vibe CLI，给出本地流式补全的断线续传落地方案：vLLM 推理参数、客户端 token 缓存策略与监控阈值。

### [Devstral2 零配置流式 vibe-coding：把 24B 模型塞进笔记本](/posts/2025/12/10/devstral2-vibe-coding-zero-config/)
- 日期: 2025-12-10T09:34:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用一条命令启动本地 Devstral2，无需写配置即可体验丝滑流式补全，给出可直接复制的参数与监控指标。

### [用运行时钩子精准干预 LLM 行为：Mentat 的幻觉止血方案](/posts/2025/12/10/runtime-intervention-mentat-hallucination/)
- 日期: 2025-12-10T09:19:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在推理阶段用运行时钩子精准干预 LLM 行为，防幻觉与循环

### [30 分钟拼装 Devstral 版 Vibe CLI：本地 24B 代码补全与蒸馏实战](/posts/2025/12/10/devstral-vibe-cli-local-distillation/)
- 日期: 2025-12-10T09:03:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Devstral-Small-2505 与社区生态，30 分钟搭出终端即时代码补全，给出 4-bit 蒸馏参数与显存回滚策略。

### [Devstral2 与 Mistral Vibe CLI：本地零配置链式调用与模型热插拔 5 分钟上手](/posts/2025/12/10/devstral2-mistral-vibe-cli-zero-config-chaining-hot-swap-guide/)
- 日期: 2025-12-10T08:54:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Mistral Devstral2 模型与 Vibe CLI 的本地部署、零配置链式调用机制与热插拔实现，提供一键安装与生产参数清单，5 分钟上手工程化代理编程。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
