# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/414/
- 当前页: 414 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [实测 Qwen3-Omni-Flash：211 ms 首 token 背后的原生多模态推理链路](/posts/2025/12/11/qwen3-omni-flash-first-token-latency/)
- 日期: 2025-12-11T05:04:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 Thinker-Talker 架构到 INT4 量化，拆解阿里开源全模态模型在边缘节点跑出 200 ms 级首 token 的完整工程参数与踩坑笔记。

### [实测 Qwen3-Omni-Flash 原生多模态推理链路：234 ms 首包延迟的工程化拆解](/posts/2025/12/11/qwen3-omni-flash-multimodal-inference-latency-optimization/)
- 日期: 2025-12-11T04:48:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从异步 chunked prefill 到左上下文多码本，逐帧还原阿里 Qwen3-Omni-Flash 在端侧实现 234 ms 首 Token 的完整优化路径与可直接落地的参数清单。

### [Kernel Float 解锁 GPU 混合精度编程：编译期类型系统零开销切换 FP16/FP32/BF16](/posts/2025/12/11/kernel-float-mixed-precision-gpu-programming/)
- 日期: 2025-12-11T04:38:28+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 用单一模板 vec<T,N> 实现编译期精度推导与向量优化，零开销支持混合精度，避免手动 intrinsic 样板代码。

### [超扁平AST：把语法树压成单层数组，实现零指针序列化与缓存友好遍历](/posts/2025/12/11/super-flat-ast-zero-pointer-serialization/)
- 日期: 2025-12-11T04:20:16+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 用单层数组+偏移编码替代传统指针树，彻底消除序列化开销并提升遍历缓存命中率，给出可直接落地的对齐、子节点上限与重建阈值参数。

### [用 Claude 的 agent-sdk 把整段编码会话实时压缩成可注入的上下文，解决长会话记忆溢出](/posts/2025/12/11/claude-mem-session-compression/)
- 日期: 2025-12-11T04:08:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: claude-mem 通过 5 个生命周期钩子实时捕获工具输出，用 Claude 自生成 500 token 观察，实现 95 % 压缩率与渐进披露，支撑 20× 工具调用寿命。

### [Kernel Float：在 GPU 内核中混用 FP32/FP16/TF32 的编译器级精度切换方案](/posts/2025/12/11/kernel-float-mixed-precision-gpu-compiler-extension/)
- 日期: 2025-12-11T04:04:32+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 介绍 Kernel Float 如何借助单一 vec<T,N> 模板与编译期决策，在同一 CUDA kernel 内自动完成 warp 级精度切换，实现 H100 上 1.4× 性能提升且误差 <1e-5，并给出可落地的寄存器分配与监控参数。

### [Qwen3-Omni-Flash 原生多模态架构：端到端统一编码与推理层设计要点](/posts/2025/12/11/qwen3-omni-flash-native-multimodal-architecture/)
- 日期: 2025-12-11T03:51:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Qwen3-Omni-Flash 如何在单一模型内完成文本、图像、音频、视频的原生融合，给出可落地的延迟、显存、并发与量化参数。

### [Rust 内核正式转正：CONFIG_RUST 启用后的模块迁移与性能实测](/posts/2025/12/11/rust-kernel-stable-migration-performance/)
- 日期: 2025-12-11T03:40:23+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Rust for Linux 摘掉实验标签后，给出启用 CONFIG_RUST 的完整构建流程、模块迁移清单与性能对比数据，帮助开发者快速上手并评估收益。

### [Rust 内核模块正式转正：ABI 稳定、驱动移植与上线 checklist](/posts/2025/12/11/rust-kernel-stable-abi-checklist/)
- 日期: 2025-12-11T03:19:30+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Linux 6.18 LTS 将摘掉 Rust 的实验标签，本文给出可落地的 ABI 稳定策略、驱动移植步骤与生产环境 checklist。

### [Rust 内核模块正式启用稳定分配器：接口选型、性能基准与模块热升级实践](/posts/2025/12/11/rust-kernel-stable-alloc/)
- 日期: 2025-12-11T02:32:34+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Linux 6.14 起，Rust 内核代码可完全用 stable 工具链编译。本文聚焦稳定分配器两大接口 kallocator 与 bumpalo 的权衡、实测数据及热升级限制，给出可落地的参数与监控要点。

### [用 Rust 实现 COM Outlook 插件：内存安全与 ABI 兼容的实战切口](/posts/2025/12/11/rust-com-outlook-addin/)
- 日期: 2025-12-11T02:05:41+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 Office 经典版仍占企业七成份额的 2025 年，用 Rust 写 COM 加载项能把崩溃率从 0.4‰ 降到 0.05‰，同时驻留内存 <2MB。本文给出可落地的 repr(C)+stdcall 骨架与 4 条性能红线，让你避开 LoadBehavior=2 的死亡回滚。

### [用 Rust 写 Outlook 插件：COM 互操作踩坑与内存安全实战](/posts/2025/12/11/rust-outlook-com-interop-memory-safety/)
- 日期: 2025-12-11T01:18:59+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Outlook 32 位进程地址空间翻倍后，Rust COM 加载项如何避开高地址误判、引用计数循环与 4-Crash 拉黑机制。

### [Rust 内核主线化：构建与 ABI 实战要点](/posts/2025/12/11/rust-kernel-mainline-build-abi/)
- 日期: 2025-12-11T00:40:43+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Rust 代码正式移出实验分支，首批内核模块合入主线：构建工具链参数、ABI 兼容规则与最小 misc 驱动实战。

### [Rust 内核模块转正后的 ABI 稳定与实时路径实战](/posts/2025/12/11/rust-kernel-modules-abi-stability-and-realtime-path/)
- 日期: 2025-12-11T00:21:00+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 从 Linux 6.14 起，Rust 不再是‘实验品’。本文给出可落地的 ABI 边界锁定方法与 PREEMPT_RT 硬实时约束清单，帮助你在第一个 LTS 周期内安全交付 Rust 驱动。

### [Rust 构建的可插拔 AI 代理框架 Goose：全链路交付工程实战](/posts/2025/12/11/goose-rust-extensible-ai-agent/)
- 日期: 2025-12-11T00:13:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入 Goose 的 MCP 插件机制、多模型混调与本地安全沙箱，给出可落地的 6 步上线清单与 Docker-Compose 模板。

### [用 Rust 内核模块热插拔机制实现零停机升级：剖析 kmod 与内存安全边界](/posts/2025/12/10/rust-kernel-module-hot-plug-zero-downtime/)
- 日期: 2025-12-10T23:48:48+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 拆解 kmod 加载流程与 DKLM 新机制，给出 25 ms 级热替换实测数据，附 unsafe 审查与回滚清单。

### [用 Devstral2 与 Vibe CLI 落地本地多模型提示流：配置、阈值与回滚策略](/posts/2025/12/10/devstral2-vibe-cli-local-multi-model-prompt-flow/)
- 日期: 2025-12-10T22:35:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 拆解 Mistral 新发布的 Devstral2 与 Vibe CLI，看本地多模型切换与提示流如何落地

### [用 Gemini Pro 3 伪造 2035 年 Hacker News 头版：一次幻觉边界实测](/posts/2025/12/10/gemini-pro-3-hallucinates-2035-hacker-news-frontpage/)
- 日期: 2025-12-10T22:03:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 让 Gemini Pro 3 生成十年后的 HN 首页，发现低幻觉率模型在未来时间线上依旧‘一本正经地胡说八道’。

### [用 Go 与 Vulkan 打造 Kaiju 引擎：高性能可视化编辑器实战指南](/posts/2025/12/10/kaiju-vulkan-game-engine-go/)
- 日期: 2025-12-10T21:51:06+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 Go 与 Vulkan 的 Kaiju 引擎实现 2 700+ FPS 与 net-0 堆分配，内置可视化编辑器支持实时代码热重载，给出跨平台构建与性能调优的落地参数。

### [用 Go + Vulkan 构建跨平台 3D/2D 游戏引擎的内置编辑器架构与热重载管线](/posts/2025/12/10/go-vulkan-kaiju-editor-hot-reload/)
- 日期: 2025-12-10T21:18:47+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 Kaiju 引擎实战，拆解 Go+Vulkan 热重载底层机制与可落地参数：模块隔离、原子函数表切换、GPU 双缓冲与 GC 零堆分配策略。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
