从二进制重建程序的能力边界:ProgramBench 代码结构理解评估
评估语言模型从零重建程序的能力,聚焦代码结构理解与重构保真度的关键技术参数与监控要点。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
评估语言模型从零重建程序的能力,聚焦代码结构理解与重构保真度的关键技术参数与监控要点。
详细阐述生产环境中基于 ZFS 存储、iSCSI 块设备与 PXE 网络引导的无盘 Linux 部署方案,涵盖网络协议调优、存储池配置与引导参数优化。
深入解析开源项目php-fts如何基于trigram构建倒排索引,涵盖索引构建、查询执行及关键工程参数。
深入解析 DeerFlow 2.0 的沙盒执行引擎、子代理调度策略与长期记忆机制,揭示其处理数分钟至数小时长时序任务的核心设计。
解析 SQLite 成为 Library of Congress 推荐存储格式后,对归档工作流、元数据管理及长期数字保存合规性的实际工程影响。
从 Permacomputing 十项设计原则出发,探讨计算系统的可持续性哲学根基,剖析其与主流技术范式的根本分歧。
解析 Addy Osmani 开源的 agent-skills 项目,提取 AI 编码代理在生产环境所需工程技能的20项结构化清单与实施要点。
从永续计算理念出发,解析计算系统的生态化工程原则:模块冗余、本地优先、低功耗与维修友好的可落地参数与设计清单。
基于 token bucket 模型与 circuit breaker 模式,为大规模 LLM 计算工作负载设计企业级限流网关,提供可落地的参数配置与监控清单。
解析SQLite作为数字归档推荐格式的核心工程优势,包括单文件自包含、ACID事务保障、零运行时依赖等关键特性及其长期保存实践参数。
从 GDPR 与知情同意原则出发,解析 Chrome 未经用户授权自动下载 AI 模型的技术实现与法律风险。
探讨 php-fts 在共享主机环境下的工程化实践,提供 BM25 评分配置、碎片化阈值与维护策略的可落地参数。
基于 Postgres 的统一后端架构如何支撑 AI coding agents 的端到端开发流程,从认证、存储、计算到 AI Gateway 的全栈整合实践。
解析Apple App Store Guideline 2.5.2如何作用于AI生成的动态应用,梳理遗留规则在自适应软件分发场景下的技术兼容架构与工程化边界。
深入对比 OpenRouter、Google AI Studio、Groq、Cerebras 等免费 LLM API 的速率限制与模型覆盖,给出成本敏感型 AI 应用的生产级接入策略。
探讨 Ladybird 如何通过自研全栈库实现真正独立的浏览器工程架构,解析其多进程模型与模块化设计。
在 BASIC 环境中实现 Vi 编辑器的文本操作核心算法,涵盖光标移动、行操作、模式状态机与终端 I/O 处理的技术细节与工程实践参数。
MIT基于物理的计算小提琴模型通过CT扫描与有限元分析,使制琴师可在制作前预听音色变化,显著降低物理原型迭代成本。
解析斯坦福 Feedback Descent 方法:如何将自然语言反馈转化为可优化的文本梯度,在数十亿参数模型上实现规模化文本优化。
以 Hallucinopedia 为切入点,探讨社区驱动的 AI 幻觉知识库在证据收集、分类体系与多模型交叉验证方面的工程实现路径。