# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/755/
- 当前页: 755 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [Rust 中离线量化 Whisper 集成：移动端电池高效低延迟语音转文字工程实践](/posts/2025/09/28/offline-quantized-whisper-rust-integration-mobile-battery-optimization/)
- 日期: 2025-09-28T21:32:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Handy 框架下探讨 Rust 集成量化 Whisper 模型，实现移动端离线 STT 的电池优化与实时推理参数配置。

### [Rust Fork Union 库中的无锁任务调度工程实践](/posts/2025/09/28/lock-free-task-scheduling-in-rusts-fork-union/)
- 日期: 2025-09-28T21:17:32+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 Rust 的 Fork Union 库中，实现无锁任务生成和动态加入，支持计算密集型工作负载的细粒度并行。提供工程参数、监控要点和最佳实践。

### [PyTorch从零实现解码器Transformer：高效KV缓存与长上下文注意力缩放](/posts/2025/09/28/pytorch-decoder-transformer-kv-cache-attention-scaling/)
- 日期: 2025-09-28T21:02:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从scratch构建PyTorch decoder-only Transformer，集成KV cache实现长上下文高效生成，并自定义注意力缩放参数。

### [yt-dlp 中模块化提取器的工程实践：处理动态 JS 站点的高可靠性下载](/posts/2025/09/28/engineering-modular-extractors-in-yt-dlp-for-dynamic-js-sites/)
- 日期: 2025-09-28T20:47:44+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 探讨 yt-dlp 中如何设计模块化提取器来应对 JavaScript 驱动的动态网站，提供 fallback 解析策略和格式选择机制，确保下载过程的高可靠性和鲁棒性。

### [初学者 AI 代理工程：简单规划、工具调用与内存持久化](/posts/2025/09/28/introductory-ai-agents-tool-calling-memory/)
- 日期: 2025-09-28T20:18:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向初学者构建基础 AI 代理，聚焦简单规划策略、工具集成实践与内存管理要点，提供可落地参数与实现清单。

### [使用 SST Opencode 工程化终端 AI 编码代理](/posts/2025/09/28/engineering-terminal-ai-coding-agents-with-sst-opencode/)
- 日期: 2025-09-28T20:07:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在终端中构建原生 AI 编码代理，使用 TypeScript 和 SST，支持模块化 LLM 集成，实现自治代码生成、重构及本地测试。提供配置参数、监控要点和落地指南。

### [构建 openpilot 端到端深度学习模型：实时车道检测、路径预测与车辆控制](/posts/2025/09/28/building-end-to-end-deep-learning-models-for-openpilot-real-time-lane-detection-path-prediction-and-vehicle-control/)
- 日期: 2025-09-28T20:02:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 openpilot 中 Supercombo 模型的构建，聚焦端到端深度学习在车道检测、路径预测和车辆控制的工程实现与参数优化。

### [使用 AutoGen 框架构建协作式 AI 代理](/posts/2025/09/28/building-collaborative-ai-agents-with-autogen/)
- 日期: 2025-09-28T19:47:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 AutoGen 框架定义代理角色、实现对话模式，并协调任务分解，在 Python 环境中解决复杂问题。适合初学者，包含实用代码示例和最佳实践参数。

### [用PyTorch从零实现Transformer-based LLM：GPT架构、下一token预测训练与LoRA聊天微调](/posts/2025/09/28/pytorch-llm-scratch-gpt-lora/)
- 日期: 2025-09-28T19:02:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文基于PyTorch从头构建GPT-like大型语言模型，详述架构设计、预训练流程及LoRA参数高效微调，实现交互式响应生成。

### [量化 MP4 元数据索引：移动设备语义搜索优化](/posts/2025/09/28/quantized-mp4-metadata-indexing-for-mobile-semantic-search/)
- 日期: 2025-09-28T18:46:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 MP4 元数据轨道嵌入量化 ANN 索引，实现无数据库依赖的子 100ms 移动语义搜索，优化压缩比与查询效率。

### [SSH3 中基于 QUIC 流实现动态端口转发与 SOCKS 隧道](/posts/2025/09/28/implement-dynamic-port-forwarding-and-socks-tunneling-over-quic-in-ssh3/)
- 日期: 2025-09-28T18:32:09+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 QUIC 流实现 SSH3 的动态端口转发与 SOCKS 隧道，支持防火墙规避与子 RTT 远程访问的工程参数。

### [利用 Supervision 可组合工具构建可扩展标注管道：对象跟踪、过滤与指标计算](/posts/2025/09/28/leverage-supervision-composable-tools-scalable-annotation-pipelines/)
- 日期: 2025-09-28T18:16:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Supervision 的 Detections、Annotators 和 trackers 构建 scalable 标注管道，支持跟踪、过滤和 metrics 计算，简化 CV 数据集 curation 与模型评估。

### [Onyx 中动态 LLM 路由与共享上下文缓存工程化](/posts/2025/09/28/dynamic-llm-routing-shared-context-caching-onyx/)
- 日期: 2025-09-28T18:06:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Onyx 平台上实现动态 LLM 路由与共享上下文缓存，支持混合模型切换和持久对话，提供工程化参数与监控要点。

### [使用 Dynamo 编排异构 GPU 上的数据中心规模 LLM 推理：Rust 异步调度与零拷贝优化](/posts/2025/09/28/orchestrating-dynamo-distributed-llm-inference-heterogeneous-gpus/)
- 日期: 2025-09-28T18:02:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Dynamo 在异构 GPU 环境下的编排机制，包括 Rust 异步调度、Raft 领导选举和零拷贝张量共享的工程实践与参数调优。

### [Rust 实现的 epoll 与 UDP 多路复用：零拷贝低延迟隐私网络栈在无遥测浏览器中的应用](/posts/2025/09/28/rust-based-epoll-and-udp-multiplexing-for-zero-copy-low-latency-private-networking-in-telemetry-free-browsers/)
- 日期: 2025-09-28T17:46:56+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 在 Helium 等隐私浏览器中，使用 Rust 构建基于 epoll 的 UDP 多路复用网络栈，实现零拷贝传输以提升低延迟隐私网络性能。

### [在 Cloudflare Anycast 网络中实现可扩展的边缘缓存和路由](/posts/2025/09/28/implementing-scalable-edge-caching-and-routing-in-cloudflare-anycast-network/)
- 日期: 2025-09-28T17:33:22+08:00
- 分类: [web-architecture](/categories/web-architecture/)
- 摘要: 本文探讨如何在 Cloudflare 的 Anycast 网络中实施可扩展的边缘缓存和路由策略，实现全球低延迟内容交付和 PoP 间的动态负载均衡，提供工程参数和监控要点。

### [使用 C++ 中的 Taskflow 和 Rust 中的 Rayon 实现依赖驱动的并行任务图](/posts/2025/09/28/implementing-dependency-driven-parallel-task-graphs-with-taskflow-in-cpp-and-rayon-in-rust/)
- 日期: 2025-09-28T17:16:38+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 超越 OpenMP 的线程级并行，探讨 Taskflow 和 Rayon 如何构建依赖驱动的任务图（DAG），提供高效执行的参数配置与监控要点。

### [在 MP4 元数据轨道中实现量化 ANN 索引：面向边缘设备的无数据库向量搜索](/posts/2025/09/28/implementing-quantized-ann-indexing-in-mp4-metadata-tracks-for-edge-devices/)
- 日期: 2025-09-28T17:07:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何将近似最近邻索引嵌入 MP4 元数据轨道，实现资源受限边缘设备上的高效语义搜索，结合 Memvid 理念与量化技术，避免外部数据库依赖。

### [优化 Gin 的流式响应处理以实现实时 API 的亚毫秒延迟](/posts/2025/09/28/optimize-gins-streaming-response-handling-for-real-time-apis/)
- 日期: 2025-09-28T16:48:27+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 探讨使用分块传输编码和零拷贝缓冲区优化 Gin 框架的流式响应处理，在数据密集型 Web 服务中实现低延迟。

### [树莓派500+机械键盘的低延迟输入处理与GPIO集成工程化](/posts/2025/09/28/low-latency-input-handling-gpio-integration-mechanical-keyboards-raspberry-pi-500/)
- 日期: 2025-09-28T16:20:23+08:00
- 分类: [embedded-systems](/categories/embedded-systems/)
- 摘要: 针对树莓派500+上的机械键盘集成，工程化低延迟输入处理与GPIO扩展，提供参数配置、监控要点及嵌入式系统落地策略。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
