Archon:首个开源AI代码评测Harness框架的设计与工程实践
深入解析Archon如何通过YAML工作流定义、Git Worktree隔离与结构化验证节点,实现AI编码任务的确定性验证与可重复评测。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
深入解析Archon如何通过YAML工作流定义、Git Worktree隔离与结构化验证节点,实现AI编码任务的确定性验证与可重复评测。
解析 RedditVideoMakerBot 如何通过 Subreddit 抓取、TTS 语音合成与 FFmpeg 渲染三大模块构建自动化视频生成流水线。
绕过信息论公式推导,用六个半工程化直觉理解 KL 散度,直接对接分布差异度量的代码实现与调参判断。
深入解析基于 NVIDIA Warp 的机器人专用物理引擎 Newton,探讨 GPU 加速刚体碰撞检测与任务级仿真的工程实践参数。
从 seomachine 项目解析 LLM 驱动的 SEO 内容生成工作流编排与提示工程最佳实践。
深入解析 Dropbox Magic Pocket 不可变 blob 存储的存储效率优化工程实践,涵盖冷热分层策略、跨区域纠删码与复制因子调优。
基于Andrej Karpathy揭示的LLM系统性编码失误,构建可编程的Claude Code技能集,实现AI编程常见陷阱的自动化规避。
深入解析 Pointer Events API 在地图交互中的工程实践,提供多点触控手势识别、缩放平移状态管理与可落地的核心参数配置。
解析 NVIDIA Warp 框架的 Python 到 CUDA 编译管线,对比传统手写 CUDA 的工程化差异,并给出物理仿真开发的实际参数建议。
深入解析SEOMachine的工程化设计,探讨如何通过自定义命令、上下文文件与专业化Agent构建生产级SEO内容生成流水线。
深入解析 botctl 的 Harness Loop 执行周期、状态迁移机制与工程化调度参数,为自主 AI Agent 的运行时进程管理提供可落地的配置清单与监控方案。
深入解析 Google LiteRT-LM C++ 推理运行时的量化融合策略、KV 缓存优化与边缘设备部署工程实践,提供可落地的配置参数。
深入解析 LittleSnitch 从 macOS 独占到跨平台的技术架构,探讨 eBPF 在 Linux 上的工程实现与局限。
深入分析 Anthropic Claude Managed Agents 的企业级部署架构,涵盖多租户隔离、安全设计、监控可观测性等工程实践要点。
深入探索301字节x86-64 ELF可执行文件的极限优化技术,解析系统加载机制与最小化二进制构建方法。
深入解析vLLM推理引擎的连续批处理调度器与PagedAttention分页内存管理机制,提供可落地的GPU利用率优化配置参数与监控要点。
深入解析 Rust 异步运行时中的任务窃取调度器设计,提供多线程负载均衡的参数配置与性能监控要点。
探讨通过 eBPF 在网卡驱动层捕获 QUIC 数据包,实现连接迁移时 IP 切换零丢包的工程化方案与关键参数配置。
聚焦推理部署阶段 KV cache 量化后数值溢出检测与精度保障的工程参数配置,给出可落地的阈值与监控清单。
深入解析Model Context Protocol服务器运行时的核心架构,提供工具描述解析、资源挂载机制与AI模型调用链的工程化参数配置。