Page 181

最新见解 · 第 181 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2026-02-02 ai-systems

Nano-vLLM推理引擎中KV缓存的内存优化:分块、压缩与动态淘汰策略

深入解析Nano-vLLM推理引擎中KV缓存的内存优化机制,包括其连续张量分块策略,并与vLLM的PagedAttention物理块池进行对比。进一步探讨动态淘汰算法与压缩思路,最后给出块大小配置、淘汰阈值设定及缓存命中率监控等可落地工程参数。

阅读全文 →
2026-02-02 systems

CedarDB 在 HTAP 场景下的 FSST 压缩参数调优指南

深入解析 CedarDB 如何通过 FSST 字符串压缩与字典编码的协同策略,在 HTAP 混合负载下平衡存储效率与查询性能,提供可落地的参数配置建议与监控阈值。

阅读全文 →