# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/181/
- 当前页: 181 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [Nano-vLLM推理引擎中KV缓存的内存优化：分块、压缩与动态淘汰策略](/posts/2026/02/02/nano-vllm-kv-cache-memory-optimization-block-eviction-compression/)
- 日期: 2026-02-02T23:43:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析Nano-vLLM推理引擎中KV缓存的内存优化机制，包括其连续张量分块策略，并与vLLM的PagedAttention物理块池进行对比。进一步探讨动态淘汰算法与压缩思路，最后给出块大小配置、淘汰阈值设定及缓存命中率监控等可落地工程参数。

### [OxCaml零分配HTTP服务器：高性能Web服务的内存管理实践](/posts/2026/02/02/oxcaml-zero-allocation-http-server-memory-management-practices-for-high-performance-web-services/)
- 日期: 2026-02-02T23:21:05+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入剖析OxCaml如何通过非装箱类型与栈分配实现零分配HTTP服务器，对比传统OCaml、Rust与Go的GC开销，为高性能Web服务提供内存管理实践指南。

### [深入解析 nano-vLLM 推理引擎的分页 KV 缓存与内存优化架构](/posts/2026/02/02/nano-vllm-architecture-deep-dive-kv-cache-scheduling/)
- 日期: 2026-02-02T22:48:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 nano-vLLM 如何通过 Triton 内核实现高效 KV 缓存管理，对比原版 vLLM 的 PagedAttention，给出内存配置与调度策略的工程化参数。

### [深入剖析nano-vLLM推理引擎架构：PagedAttention内存管理实现](/posts/2026/02/02/nano-vllm-inference-engine-architecture-deep-dive/)
- 日期: 2026-02-02T22:30:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从操作系统分页机制汲取灵感，解析vLLM核心创新PagedAttention如何通过块级内存管理消除KV缓存碎片，实现10-23倍吞吐量提升。

### [Nano-vLLM 轻量级推理引擎架构解析：PagedAttention 与 KV Cache 管理机制](/posts/2026/02/02/nano-vllm-inference-engine-architecture/)
- 日期: 2026-02-02T22:04:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入剖析 Nano-vLLM 如何以约 1200 行 Python 代码实现 vLLM 风格推理引擎的核心机制，涵盖 PagedAttention 轻量化实现、KV Cache 动态管理及连续批处理调度策略。

### [用 OxCaml 实现零分配 HTTP 服务器：内存池与栈分配实战](/posts/2026/02/02/zero-allocation-http-server-oxcaml/)
- 日期: 2026-02-02T21:16:24+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入解析如何利用 OxCaml 的非装箱类型、局部分配和零分配检查器，在不触发垃圾回收的前提下构建高性能 HTTP 服务器。

### [iPhone端MLX LLM推理的内存布局与计算精度问题：层融合与量化校准优化方案](/posts/2026/02/02/mlx-ios-llm-inference-optimization/)
- 日期: 2026-02-02T20:46:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对iOS端MLX LLM推理的内存布局与计算精度问题，提出层融合与量化校准的端侧优化方案，包含工程化参数与监控要点。

### [C++ 手写 uint128：算术运算的内联优化与除法性能调优](/posts/2026/02/02/custom-uint128-arithmetic-optimization/)
- 日期: 2026-02-02T20:30:38+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入探讨手写 uint128 的底层实现，剖析加法、乘法、除法等运算的指令级优化策略，对比 intrinsics 与编译器内置 __uint128_t 的性能差异。

### [用 VisualJJ 可视化 Jujutsu 版本控制：状态机模型与工程实践](/posts/2026/02/02/visualjj-jujutsu-visualization-guide/)
- 日期: 2026-02-02T20:26:50+08:00
- 分类: [developer-tools](/categories/developer-tools/)
- 摘要: 解析 Jujutsu 版本控制系统的核心状态机模型，以及 VisualJJ 插件如何用图论视图降低 JJ 学习曲线，提供拖拽式 rebase 与延迟冲突解决的工程化参数。

### [RooDB 基于 RAFT 的高性能开源集群数据库实现分析](/posts/2026/02/02/roodb-raft-clustered-database/)
- 日期: 2026-02-02T20:15:37+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入分析 RooDB 的核心架构，探讨其基于 OpenRaft 的共识机制、LSM 存储引擎设计以及 MySQL 兼容协议的实现策略。

### [Apate：将 API 模拟、原型设计与 Rust 单元测试集成为单一工具的实践](/posts/2026/02/02/apate-api-mocking-prototyping-unit-testing-rust/)
- 日期: 2026-02-02T20:06:02+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入探索 Apate 如何通过统一 API 模拟服务器与 Rust 单元测试库，实现开发与测试环境的无缝切换和一致性保证。

### [CedarDB FSST压缩参数调优：动态字典更新阈值与内存平衡](/posts/2026/02/02/cedar-db-fsst-compression-tuning-dynamic-dictionary-update-thresholds-memory-balance/)
- 日期: 2026-02-02T19:45:41+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入分析CedarDB集成FSST字符串压缩算法时的参数调优策略，包括针对HTAP负载的动态字典更新阈值与内存占用平衡。

### [FSST 字符串压缩在 HTAP 数据库中的参数调优指南](/posts/2026/02/02/fsst-parameter-tuning-for-htap-databases/)
- 日期: 2026-02-02T19:00:35+08:00
- 分类: [database-engineering](/categories/database-engineering/)
- 摘要: 针对混合事务/分析处理（HTAP）场景，深入解析 FSST 压缩算法的核心参数，并提供基于负载特征的符号表大小、训练策略与更新阈值的调优建议。

### [CedarDB 在 HTAP 场景下的 FSST 压缩参数调优指南](/posts/2026/02/02/cedar-db-fsst-htap-tuning-parameters/)
- 日期: 2026-02-02T18:30:36+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入解析 CedarDB 如何通过 FSST 字符串压缩与字典编码的协同策略，在 HTAP 混合负载下平衡存储效率与查询性能，提供可落地的参数配置建议与监控阈值。

### [CedarDB FSST 压缩在 HTAP 负载下的动态自适应调优策略](/posts/2026/02/02/cedar-fsst-htap-dynamic-tuning/)
- 日期: 2026-02-02T18:15:37+08:00
- 分类: [database-systems](/categories/database-systems/)
- 摘要: 分析 CedarDB 集成 FSST 字符串压缩时，如何根据 HTAP 负载特性（OLTP 写放大 vs OLAP 扫描吞吐）动态调整字典更新阈值与压缩块大小。

### [Actor 模型四十年：从 Agha 1985 论文到 Akka 与 Erlang 的工程实践](/posts/2026/02/02/actors-model-1985-vs-akka-erlang/)
- 日期: 2026-02-02T18:00:40+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 追溯 1985 年 Gul Agha 的 Actor 模型奠基论文，对比现代框架在消息传递、监督策略与容错机制上的工程取舍。

### [Cedardb FSST 字符串压缩的 HTAP 调优：阈值选择与字典更新策略](/posts/2026/02/02/cedardb-fsst-htap-tuning-threshold-dictionary-update/)
- 日期: 2026-02-02T17:00:43+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 分析 Cedardb 如何为 HTAP 混合负载调优 FSST 压缩阈值与字典更新策略，给出基于访问模式的动态阈值调整参数与增量更新监控要点。

### [蜂窝三角定位精度剖析：从百米误差到iOS的隐私阀门](/posts/2026/02/02/cellular-triangulation-precision-ios-limit-location/)
- 日期: 2026-02-02T16:15:44+08:00
- 分类: [security-privacy](/categories/security-privacy/)
- 摘要: 深入解析移动运营商通过基站信号进行三角定位的技术原理、典型精度范围，以及iOS系统如何通过‘限制精确位置’功能为用户提供隐私控制。

### [CedarDB 集成 FSST 字符串压缩的 HTAP 参数调优指南](/posts/2026/02/02/cedardb-fsst-compression-tuning-htap/)
- 日期: 2026-02-02T15:45:41+08:00
- 分类: [systems](/categories/systems/)
- 摘要: 深入解析 CedarDB 混合存储引擎 Colibri 与 FSST 压缩算法的协同机制，提供 OLTP/OLAP 混合负载场景下的阈值配置、字典调优与监控实操指南。

### [Sandbox Agent SDK 统一 API 实现：跨平台隔离与工具调用管理](/posts/2026/02/02/sandbox-agent-sdk-unified-api-implementation-cross-platform-isolation/)
- 日期: 2026-02-02T15:00:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Rivet Sandbox Agent SDK 的工程实现，聚焦于跨平台沙盒抽象、统一会话管理与安全工具调用的核心参数与部署清单。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
