# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/757/
- 当前页: 757 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [用 Handy 在 Rust 中工程化跨平台实时语音转文本](/posts/2025/09/28/engineering-cross-platform-real-time-speech-to-text-in-rust-with-handy/)
- 日期: 2025-09-28T11:16:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Handy 开源项目中用 Rust 构建的异步音频管道、Whisper 集成和低延迟缓冲策略，适用于桌面/移动转录应用。

### [HumanLayer 中基于图的导航与 Pub-Sub 协议的多代理协调](/posts/2025/09/28/graph-navigation-and-pub-sub-protocols-in-humanlayer-for-multi-agent-coordination/)
- 日期: 2025-09-28T11:01:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 HumanLayer 框架如何通过图导航和发布-订阅协议实现 AI 编码代理在复杂代码库中的高效协调，提供工程参数和最佳实践。

### [构建 Brainfuck 和 INTERCAL 的最小解释器：探索受限语法下的图灵完备计算](/posts/2025/09/28/building-minimal-interpreters-for-brainfuck-and-intercal/)
- 日期: 2025-09-28T10:47:20+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 面向奇诡编程语言，给出 Brainfuck 和 INTERCAL 解释器的工程实现与优化参数要点。

### [优化 Typst 的并行渲染管道](/posts/2025/09/28/optimizing-typsts-parallel-rendering-pipeline/)
- 日期: 2025-09-28T10:32:01+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: Typst 通过并行处理标记语言优化大型技术文档的 PDF 生成，实现亚秒级编译。探讨管道设计、可落地参数与监控要点。

### [在 RAG-Anything 中使用 IVF-PQ 索引和重排序优化混合检索](/posts/2025/09/28/optimize-hybrid-retrieval-ivf-pq-reranking-rag-anything/)
- 日期: 2025-09-28T10:17:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 RAG-Anything 的混合稠密-稀疏检索，应用 IVF-PQ 量化索引减少内存消耗，同时集成 Cross-Encoder 重排序提升跨域 QA 精度，提供生产级参数配置和监控要点。

### [Rust Foyer 缓存中的无锁并发访问工程化](/posts/2025/09/28/lock-free-concurrent-caching-in-rust-foyer/)
- 日期: 2025-09-28T10:06:44+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 Rust 的 Foyer 混合缓存中，使用原子操作和风险指针实现无锁并发访问，提供高吞吐量的 S3 对象检索，避免线程争用下的性能瓶颈。

### [使用 Memvid 在 MP4 中缩放向量嵌入：边缘设备上的百万级语义搜索优化](/posts/2025/09/28/scaling-vector-embeddings-in-mp4-for-edge-search-with-memvid/)
- 日期: 2025-09-28T10:01:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Memvid 如何处理数百万文本块的向量嵌入缩放，提供无数据库的 MP4 语义搜索优化参数与索引策略。

### [SSH3 over HTTP/3 中的安全密钥交换与认证：利用 QUIC 实现前向保密](/posts/2025/09/28/secure-key-exchange-authentication-ssh3-http3-quic-forward-secrecy/)
- 日期: 2025-09-28T09:47:56+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: 在高延迟网络中，SSH3 通过 QUIC 头实现高效的安全密钥交换和认证，利用 TLS 1.3 提供前向保密，无需额外 RTT。工程化参数包括握手超时阈值和认证令牌管理要点。

### [利用 Gin 的 Radix-Tree 路由和上下文池化实现微服务 40 倍 HTTP 处理加速](/posts/2025/09/28/leverage-gin-radix-tree-routing-and-context-pooling-for-40x-faster-http-handling-in-microservices/)
- 日期: 2025-09-28T09:32:00+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 基于 Gin 框架的 Radix-Tree 路由和上下文池化机制，结合模块化中间件优化微服务 HTTP 处理，提供工程化参数与监控策略。

### [利用 Windows ML API 运行 ONNX 模型：桌面应用跨设备推理集成](/posts/2025/09/28/leveraging-windows-ml-apis-for-onnx-model-inference-in-desktop-apps/)
- 日期: 2025-09-28T09:16:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Windows ML API 在桌面应用中集成 ONNX 模型推理，支持 CPU/GPU 加速，实现高效的本地 ML 部署。

### [HumanLayer 中的基于图的代码库导航系统](/posts/2025/09/28/humanlayer-graph-based-codebase-navigation/)
- 日期: 2025-09-28T09:01:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建图基导航和动态上下文检索系统，帮助 AI 编码代理高效处理大型代码库的重构任务，提供工程化参数。

### [反向工程 Flash Attention 4 的专有融合注意力内核：复制商品 GPU 上的高吞吐多查询 Transformer 推理](/posts/2025/09/28/reverse-engineering-flash-attention-4-kernels-for-multi-query-transformer-inference/)
- 日期: 2025-09-28T08:47:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨反向工程 Flash Attention 4 专有融合内核的技术，针对多查询 Transformer 推理，提供在消费级 GPU 上的复制实现，包括内核融合策略、内存优化参数和性能监控要点。

### [Gin 框架中的 Context 复用优化：减少分配与 GC 压力](/posts/2025/09/28/gin-context-reuse-optimization/)
- 日期: 2025-09-28T08:31:51+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 面向高并发 API 服务，给出 Gin Context 池化复用的工程化实现与参数调优要点。

### [工程化 FlashAttention-4 内核移植到 ROCm：HIP 迁移与多查询推理优化](/posts/2025/09/28/engineering-flash-attention-4-kernel-port-to-rocm-hip-migration-multi-query-optimization/)
- 日期: 2025-09-28T08:16:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 AMD GPU 的 FlashAttention-4 移植，给出 HIP 迁移步骤、内存优化要点与多查询推理工程参数。

### [工程化模块化 TypeScript 组件：AI 驱动英语练习的实时发音反馈与自适应难度](/posts/2025/09/28/modular-typescript-components-for-ai-english-exercises-pronunciation-feedback-and-adaptive-scaling/)
- 日期: 2025-09-28T08:06:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨使用 TypeScript 构建模块化组件，实现 AI 英语学习工具的实时发音反馈和自适应难度调整。提供工程参数、监控要点和落地清单，帮助开发者高效集成交互式语言模块。

### [Python 类型提示的渐进式采用工程实践](/posts/2025/09/28/gradual-adoption-of-python-type-hints-in-engineering/)
- 日期: 2025-09-28T08:01:52+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 面向遗留代码库，给出 Python 类型提示渐进引入的工程策略、工具参数与监控清单。

### [使用 SIMD 向量化实现行优先 CSV 解析以达到 10GB/s 吞吐量](/posts/2025/09/28/simd-vectorization-row-major-csv-parsing-10gbs-throughput/)
- 日期: 2025-09-28T07:46:48+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 面向大数据处理，给出 SIMD 向量化在行优先 CSV 解析中的应用，实现无分支开销的高吞吐量优化参数与监控要点。

### [Firefox 集成 Google Lens：客户端视觉搜索实现](/posts/2025/09/28/firefox-google-lens-integration-client-side-visual-search/)
- 日期: 2025-09-28T07:32:07+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 探讨在 Firefox 浏览器中集成 Google Lens API，实现客户端图像上传、结果渲染与隐私控制，提升视觉搜索体验。

### [在 RAG-Anything 中集成混合稠密-稀疏检索器：模块化管道与 IVF-PQ 索引](/posts/2025/09/28/integrating-hybrid-dense-sparse-retrievers-in-rag-anything/)
- 日期: 2025-09-28T07:16:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何在 RAG-Anything 框架中结合稠密和稀疏检索器、reranking 以及 IVF-PQ 索引，实现高效的跨域检索增强生成。提供工程参数和最佳实践。

### [逆向工程 Flash Attention 4 的融合注意力内核：针对 GPU 多查询 Transformer 推理优化](/posts/2025/09/28/reverse-engineering-flash-attention-4s-fused-attention-kernels-for-gpu-multi-query-transformer-inference/)
- 日期: 2025-09-28T07:01:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过逆向分析 Flash Attention 4 的融合内核，探讨其在多查询注意力下的内存访问优化与内核融合技术，提供工程参数与监控要点，实现高效的 Transformer 推理。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)