10PB 2RU存储密度工程:FTL映射权衡与NVMe-oF密度突破
解析Kioxia LC9 245TB QLC SSD在Dell PowerEdge R7725xd中的密度极限实现,深入FTL映射层、纠删码布局与NVMe-oF网络调优的工程权衡。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
解析Kioxia LC9 245TB QLC SSD在Dell PowerEdge R7725xd中的密度极限实现,深入FTL映射层、纠删码布局与NVMe-oF网络调优的工程权衡。
解析 UTF-16 解析器中无效代理对(0xD800-0xDFFF)的验证缺失如何导致字符串截断、JSON 乱码与安全漏洞的因果链路,并给出工程化防护参数。
深度解析 noahgolmant/pytorch-hessian-eigenthings 的八年重构历程:从 numpy/scipy 手动求导迁移到现代 autograd,Hessian-vector product 规避 O(n²) 存储瓶颈,Kronecker 分解近似的工程落地路径。
深入解析 Orthrus 双视图注意力架构如何通过扩散模块与自回归基座的协同,在保持输出分布一致性的前提下实现 7.8 倍单次前向吞吐量提升。
分析在 Linux NT 兼容层上运行 Win9x 程序的 ring transition 开销、PE 加载器适配策略与 User/GDI 子系统翻译路径。
深入解析 Supertonic 如何将量化 ONNX 模型嵌入 Swift 运行时,通过流式推理调度与 CoreAudio 渲染管线实现设备端多语言低延迟语音合成。
解析 Superpowers 框架中基于 SKILL.md 前置元数据的技能注册、发现与编排机制,涵盖优先级体系、指令覆盖规则与模块化编排实践。
剖析 Orthrus 双架构框架如何通过 Dual-View Attention 在 Qwen3 上实现 7.8× tokens/forward 吞吐量提升,同时保持无损生成与 O(1) 增量内存开销的工程路径。
聚焦 UTF-16 字符串解析与序列化过程中 Invalid Surrogate Pairs 的隐性陷阱,给出 JS/Java 互操作区的边界条件检测与工程修复路径。
面向多模型流式输出,给出 SSE 连接管理与断线续传的工程化参数与监控要点。
深入解析 Julia Evans 从 Tailwind CSS 迁移至手写 CSS 的实战经验,涵盖选择器粒度控制、组件化架构设计、设计令牌系统与构建流程优化等核心工程决策。
解析 Orthrus 通过冻结预训练 AR 基座加轻量扩散模块实现 7.8× tokens/forward 加速的核心机制与工程权衡。
面向数据库系统设计者,深入解析如何在NVMe堆栈层通过LBA排布策略与批量提交机制协同减少写入放大,实现吞吐量翻倍与SSD寿命延长。
解析Charity语言如何将无类型化函数式计算映射为余积构造指令,对比Haskell的类型导向编译路径,揭示两种范畴论编译策略的工程权衡。
深入解析 CodeGraph 如何通过预索引知识图谱将代码语义压缩为可查询节点,使 Claude Code 的工具调用次数降低 94%,探索速度提升 77%。
解析 SANA-WM 如何用混合线性注意力、双分支相机控制和显存分片策略,在单张 GPU 上生成 1 分钟 720p 视频,训练成本仅为 64 H100 × 15 天。
深入解析Orthrus-Qwen3如何在自回归基座与并行扩散头之间共享同一KV缓存,实现O(1)内存增量下7.8倍吞吐提升的一致性验证机制。
从 Open-Generative-AI 项目出发,解析 200+ 模型 Ensemble 调度的工程架构,评估无审查内容策略与本地推理的权衡,给出自托管部署的关键参数配置。
解析 page-mapped FTL 中写放大(Write Amplification)的因果链,给出 WAF = 1/(1-S) 的推导、参数含义与工程阈值参考。
从几何误差下界与收敛速度角度量化 Sigmoid 逼近阶跃函数的理论极限,揭示为何在 Shallow 网络中 Sigmoid 的宽度需求在实际部署中不可接受。