# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/761/
- 当前页: 761 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [SQLite 向量搜索中产品量化的优化](/posts/2025/09/27/optimizing-product-quantization-in-sqlite-vector-search/)
- 日期: 2025-09-27T15:31:45+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 针对内存受限场景，调优产品量化码本大小与重建阈值，提升 SQLite 向量扩展的存储效率与近似最近邻搜索性能。

### [Moondream3 边缘推理自定义 CUDA 内核：分组查询注意力优化](/posts/2025/09/27/moondream3-edge-inference-custom-kernels/)
- 日期: 2025-09-27T15:16:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Moondream3 的分组查询注意力，工程自定义 CUDA 内核，实现边缘 GPU 上 2 倍加速的实时推理，提供无精度损失的低功耗参数与监控要点。

### [LiteX 中的交互式运行时学习：增量解析与实时类型反馈](/posts/2025/09/27/interactive-runtime-learning-in-litex/)
- 日期: 2025-09-27T15:01:47+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 针对定理证明形式语言的学习，实现交互式运行时，支持增量解析和实时类型反馈，实现1-2小时高效学习。

### [public-apis工程实践：构建大规模API集合的数据架构与自动化维护系统](/posts/2025/09/27/public-apis-engineering-architecture/)
- 日期: 2025-09-27T14:48:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析超20万星标public-apis项目的三层架构设计、数据管理策略和自动化维护流水线，探讨大规模API集合系统的工程实践要点。

### [使用 Exo 框架在异构家庭设备上编排分布式 AI 推理：容错与低延迟优化](/posts/2025/09/27/orchestrating-heterogeneous-ai-inference-with-exo/)
- 日期: 2025-09-27T14:46:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对异构家庭设备如手机和手表，使用 Exo 框架进行故障容忍、低延迟的分布式 AI 推理编排，给出动态负载均衡和任务迁移的工程参数。

### [为 Litex 构建轻量级解析器和类型检查器](/posts/2025/09/27/building-lightweight-parser-and-type-checker-for-litex/)
- 日期: 2025-09-27T14:31:46+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 面向 Litex 可学习形式语言，给出轻量级解析器和类型检查器的工程化参数与实现要点，支持验证管道中的快速原型设计。

### [Building Modular Terminal AI Agents with Gemini CLI](/posts/2025/09/27/building-modular-terminal-ai-agents-with-gemini-cli/)
- 日期: 2025-09-27T14:16:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Gemini CLI 的核心架构，支持流式响应、动态工具调用和 MCP 插件扩展，实现无缝 CLI 集成。提供工程化参数和配置指南，帮助开发者构建高效的终端 AI 工作流。

### [Gin 中集成 HttpRouter Radix-Tree 实现 40 倍 HTTP 路由加速](/posts/2025/09/27/integrate-httprouter-radix-tree-in-gin-for-40x-faster-http-routing/)
- 日期: 2025-09-27T14:06:44+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 针对高吞吐 API，优化 Gin 中的 HttpRouter radix-tree 路径匹配和中间件链，提供工程化参数与基准测试要点。

### [Dolphin 中的异构锚点融合技术：集成布局解析与多模态线索实现精确表格提取](/posts/2025/09/27/heterogeneous-anchor-fusion-in-dolphin-for-precise-table-extraction/)
- 日期: 2025-09-27T14:01:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Dolphin 模型中异构锚点融合工程技术，用于文档图像的布局解析与多模态线索整合，实现表格提取和表单理解的精确性，提供可落地参数和监控要点。

### [RAG-Anything 中的模块化 RAG 编排：混合检索与重排序管道](/posts/2025/09/27/modular-rag-orchestration-in-rag-anything/)
- 日期: 2025-09-27T13:46:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 LightRAG 的 RAG-Anything 框架，通过模块化管道实现 hybrid dense-sparse 检索、重排序和 LLM 生成，支持可插拔索引与评估钩子，用于构建可扩展 QA 系统。

### [人形机器人灵巧性学习：模仿与强化学习的传感器运动管道工程](/posts/2025/09/27/sensorimotor-pipelines-for-humanoid-dexterity-imitation-reinforcement/)
- 日期: 2025-09-27T13:32:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨工程传感器运动管道，结合模仿学习从人类演示获取初始技能，并用强化学习优化，实现人形机器人在动态非结构化环境中的精细操纵，提供实用参数和策略。

### [使用 Elephantshark 实现非侵入式 Postgres 网络监控](/posts/2025/09/27/implement-non-intrusive-postgres-network-monitoring-with-elephantshark/)
- 日期: 2025-09-27T13:16:46+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 Neon serverless 数据库中，通过 Elephantshark 工具进行实时查询分析和性能调试的非侵入式方案，包括关键参数配置与监控要点。

### [Moondream 3 中分组查询注意力与内核融合的工程实践：边缘设备高吞吐量推理](/posts/2025/09/27/grouped-query-attention-kernel-fusion-moondream3-throughput/)
- 日期: 2025-09-27T13:01:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Moondream 3的视觉推理任务，介绍GQA机制与内核融合的集成，实现边缘设备上50+ tokens/sec的吞吐量优化，同时保持准确性。

### [使用 Pgshark 拦截 Postgres 线协议](/posts/2025/09/27/intercepting-postgres-wire-protocol-with-pgshark/)
- 日期: 2025-09-27T12:46:37+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 通过 Wireshark 插件 Pgshark 拦截 Postgres 线协议，实现实时查询日志和性能指标监控，无需修改应用或数据库。

### [Moondream 3 中的量化感知训练与分组查询注意力：边缘设备 OCR/VQA 亚秒级延迟优化](/posts/2025/09/27/moondream-3-quantization-aware-training-grouped-query-attention-edge-ocr-vqa/)
- 日期: 2025-09-27T12:32:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Moondream 3 管道，工程化量化感知训练和 GQA 以实现移动边缘设备上的亚秒级延迟 OCR/VQA，提供参数配置与监控要点。

### [使用 Unsloth 工程化低内存 OSS RL 管道加速 GPT 微调](/posts/2025/09/27/engineering-low-memory-oss-rl-pipelines-gpt-fine-tuning-unsloth/)
- 日期: 2025-09-27T12:16:48+08:00
- 分类: [ai-engineering](/categories/ai-engineering/)
- 摘要: 面向开源 GPT 模型的对齐训练，给出低内存 RL 管道的 Unsloth 实现、量化 LoRA 参数与分布式配置要点。

### [使用 Gemini Cookbook 示例构建可扩展的多模态管道：提示链、视觉语言集成与评估](/posts/2025/09/27/building-scalable-multimodal-pipelines-with-gemini-cookbook-examples/)
- 日期: 2025-09-27T12:07:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Gemini Cookbook 的官方示例，探讨如何通过提示链实现多模态输出管道，集成视觉语言模型，并使用 grounding 和 batch mode 进行评估，确保 AI 系统的高可靠性和可扩展性。

### [通过增量更新和对象流不一致检测PDF伪造：数字取证工作流中的自动化链式保管验证](/posts/2025/09/27/detecting-pdf-forgeries-incremental-updates-object-streams/)
- 日期: 2025-09-27T12:02:19+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: PDF增量更新易被用于伪造签名，本文提供对象流分析检测方法及自动化验证参数，实现数字取证链式保管。

### [Engineering Scalable Batch Processing Pipelines with SimpleFold for High-Throughput Protein Predictions in Drug Discovery](/posts/2025/09/27/engineering-scalable-batch-processing-pipelines-with-simplefold-for-high-throughput-protein-predictions-in-drug-discovery/)
- 日期: 2025-09-27T11:46:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何利用 SimpleFold 构建高效批处理管道，实现药物发现工作流中的大规模蛋白质结构预测。重点包括分布式推理配置、HPC 集成和性能优化参数，确保高通量和可靠性。

### [Rerun 与 MCAP 集成：高效机器人数据存储与实时可视化](/posts/2025/09/27/rerun-mcap-integration/)
- 日期: 2025-09-27T11:31:56+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 探讨 Rerun 如何集成 MCAP 格式，实现多传感器机器人数据的高效存储、schema 感知和零拷贝回放，提供可视化参数与最佳实践。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)