AI Agent工程化构建模式:工具调用、记忆管理与自主决策链设计
从Simon Willison的Agentic Engineering Patterns项目出发,拆解AI Agent在工具调用、记忆管理与自主决策链上的工程实践设计。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
从Simon Willison的Agentic Engineering Patterns项目出发,拆解AI Agent在工具调用、记忆管理与自主决策链上的工程实践设计。
深入解析 RFC 9849 定义的 ECH 机制,从密钥配置、客户端加密流程、服务器解密处理到填充策略,提供工程落地的完整参数与实现要点。
深入解析 RFC 9849 定义的 ECH 机制,从密钥配置、客户端加密流程、服务器解密处理到填充策略,提供工程落地的完整参数与实现要点。
解析 PostgreSQL JIT 编译器的工程优化路径:通过内联与成本阈值调优,对齐现代 CPU 微架构特征,提升热点查询的向量化与内联效率。
面向多轮对话场景,解析 LMCache 如何通过零拷贝架构与在线融合机制实现 KV Cache 的跨层级加速。
深度解析Speculative Speculative Decoding(SSD):通过并行化投机验证循环与动态Draft长度调整,实现无损的LLM推理加速。
深度解析Speculative Speculative Decoding如何通过预投机缓存与验证结果预测,实现draft与verify阶段的流水线重叠,给出工程化关键参数。
通过 TypeScript 代码实例深入讲解 CRDT 核心概念,实现无需中心协调的分布式数据一致性,包含 G-Counter、PN-Counter 等常用计数器。
实现实时语音交互的关键工程实践:分配延迟预算、流式管道设计与各组件参数调优,确保E2E低于500ms。
Gleam 程序打包独立可执行文件的实用指南,覆盖嵌入 BEAM 的 escript 和 JS 转 native 的完整流程、参数优化与部署清单。
剖析 M4 ANE 矩阵乘法硬件加速器设计、SRAM 瓦片限制、推理优化参数,包括 1×1 卷积替代 matmul 的 3 倍加速与 32MB 阈值。
开源 Omni 项目基于 Postgres ParadeDB + pgvector,实现混合搜索、RAG 聊天和对话历史存储,支持职场工具连接,自托管部署参数与优化要点。
Rust 重写的 SQLite,支持页级 MVCC 和专用 WAL 通道的多写者并发,提供工程参数、配置清单与监控要点。
Timber将XGBoost、sklearn等经典ML模型编译为原生C99代码,实现336倍Python加速,提供Ollama式HTTP服务接口的部署参数与优化要点。
针对浏览器代理分发循环,剖析 MCP 协议相对于 CLI 的优势:有状态会话、更低延迟、无子进程开销,并提供工程决策参数与监控清单。
基于 AIRI 开源项目,使用 Docker Compose 容器化自托管 Grok 伴侣,支持边缘设备实时语音聊天及 Minecraft/Factorio 多模态代理自主玩法,提供部署参数、阈值与监控要点。
基于 Claude Scientific Skills 工程化研究管道:数据分析流程、模拟工具、金融模型,包含结构化验证循环与领域特定提示模板。
基于开源 AIRI 项目,工程化自托管灵魂容器,实现实时语音聊天、多模态交互及 Minecraft/Factorio 代理,支持边缘设备部署的关键参数与清单。
针对 LEO 巨型星座数据爆发过载问题,提供动态波束切换、激光星间链路的关键参数与工程落地清单。
通过浏览器事件循环实现 tokenizer、训练循环、KV 缓存和推理的逐步交互可视化,结合简单 JS agent 提供引导式教学。