浮点数打印与解析:如何用单次乘法突破性能瓶颈
解析 Russ Cox 的 Fast Unrounded Scaling 算法,如何用一次 64 位乘法实现比 Dragon4、Ryū、Dragonbox 更快的浮点数转换,同时代码更简洁。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
解析 Russ Cox 的 Fast Unrounded Scaling 算法,如何用一次 64 位乘法实现比 Dragon4、Ryū、Dragonbox 更快的浮点数转换,同时代码更简洁。
深入剖析 Goose Agent 在测试执行时的动态工具路由机制:结果解释、工具选择与重试策略的反馈闭环工程实现。
深入解析 DeepSeek FlashMLA 如何通过共享内存切片策略与 Bank 冲突避免机制,在 NVIDIA Hopper 架构上实现 MLA 推理的性能突破,提供可复现的调参建议。
深入解析 Compyle 低延迟开发沙箱的架构演进,涵盖路由层优化、预热池设计与生产部署策略。
深入剖析 OpenAI Codex 的代理循环核心架构,聚焦上下文窗口管理、提示缓存策略与对话压缩机制的工程实践参数。
深入解析 UltraRAG v3 的声明式管道配置语法,探讨基于 YAML 的低代码 RAG 系统构建方法、控制结构设计与可视化工程实践。
解析 UltraRAG v3 如何通过 Model Context Protocol 将检索、生成、校验等核心组件抽象为独立 MCP Server,配合 YAML 配置实现复杂 RAG 流程的低代码编排。
解析 Russ Cox 的非舍入缩放原语如何统一固定宽度与最短宽度打印,性能超越 Dragonbox、Ryū 等现有算法。
深入解析 Chromium 项目禁止使用的 C++ 语言特性,剖析每项禁令背后的安全漏洞案例与替代方案设计。
通过硅级逆向工程,拆解 8086 处理器中 ALU 与微代码之间的控制信号生成机制,涵盖 LUT 配置、PLA 解码与 Bootstrap 驱动电路。
解析 Whosthere 的无特权 LAN 发现架构:mDNS/Bonjour 与 SSDP 服务发现、TCP/UDP 触发 ARP 缓存的机制,以及 Go 并发扫描器的状态管理与配置参数。
深入解析 browser-use 如何通过 CDP 协议与可访问性抽象层,让 AI Agent 能以自然语言指令自动化浏览器任务,涵盖三层架构、任务状态机与生产部署的关键参数。
通过芯片die照片逆向工程,深入剖析 Intel 8086 处理器的算术逻辑单元实现细节,揭示曼彻斯特进位链、可配置多路复用器与动态锁存器的精妙设计。
深入分析 Codex CLI 的 ReAct 风格代理循环,涵盖动作生成约束、迭代终止条件、状态持久化与沙箱安全机制,提供工程配置参数参考。
剖析 Goose 如何通过插件化后端抽象层实现 LLM provider 的灵活切换,解析其架构设计中接口层、Agent 核心与扩展模块的工程化实践。
解析 Cloudflare 如何在 25 分钟内检测、响应并修复一次 BGP 路由泄露事件,聚焦 Anycast 边缘网络的流量调度影响与自动化处置策略。
解析 Russ Cox 提出的快速无舍入缩放原语,探讨如何用一个统一算法框架同时实现高性能的浮点数打印与解析。
深入解析 DeepSeek FlashMLA 针对 Multi-Head Latent Attention 的 CUDA kernel 优化策略,聚焦共享内存 bank conflict 规避与压缩 KV cache 的内存布局设计。
从 Zsweep 项目解析 Vim 风格 Modal Input 映射到扫雷网格的 TUI 状态机设计,涵盖 Normal/Visual 模式切换、光标移动与格子操作的命令冲突消解策略。
聚焦 AS 路径验证算法与 RPKI 基础设施,解析路由泄露检测的技术实现与工程化部署参数。