Page 422
最新见解 · 第 422 页
共 16860 篇文章,分类 267 个。
最新见解
近期的思考与工程笔记。
拆解 Google Titans 的“长期记忆”模块:如何在外存-缓存-模型三层架构下做到 2M token 线性扩展
用一句话概括:把 MLP 权重当‘外存’,用 SGD 增量更新实现 O(1) 每 token 计算,再叠 128 k 滑动窗口注意力当‘缓存’,Google Titans 在 2 M 长度下仍保持 90% needle 召回,只花 1.8× 算力。
把 Logo 式海龟绘图压缩到几十行 JS,在线分享可执行参数化艺术
用 Turtletoy 的极简 Turtle API,30 行代码就能生成可交互、可绘图机输出的参数化玫瑰,一键把变量变滑杆,让观众秒变二创作者。
LockGit:Go 实现的 Git 加密密钥仓,一键解决本地/CI 明文泄露
介绍 LockGit 的加密机制、CLI 用法与 CI 集成要点,给出可落地的密钥长度、权限、rotate 参数与监控脚本,彻底杜绝本地与持续集成中的明文 secrets 泄露风险。
拆解 Google Titans 长期记忆模块:推理阶段如何增量更新并压缩百万 token 上下文
深入 Titans 的 Neural Long-Term Memory 架构,揭示推理时动态更新权重、惊喜指标筛选与 200 万 token 无损召回的工程化细节与落地参数。
用 Nango 实现千级 OAuth 连接器热更新:零中断架构与多租户隔离策略
拆解 Nango 如何在千级 OAuth 连接器场景下实现热更新与多租户隔离,提供可落地的工程化参数与监控要点。
GitHub Actions 包管理器依赖解析缺陷与提速规避方案
拆解 GitHub Actions 内建 pkg-manager 依赖解析瓶颈,给出缓存优化、pnpm 迁移与自托管镜像的工程参数与监控清单。
拆解 Google Titans 记忆模块:神经长久记忆 + 短期上下文窗口实现 2M token 级推理
从惊喜指标到 MIRAS 四维设计空间,给出可落地的超参、监控与回滚方案,让长记忆模型不再只是论文概念。
RustFS 4KB小对象IOPS碾压MinIO:异步I/O与零拷贝调优实战
拆解RustFS如何在4KB随机读场景以1.58M IOPS领先MinIO 42%,给出可落地的NVMe队列、tokio worker与内存池参数组合。
拆解 Google Titans 长期记忆模块:推理阶段如何增量更新并压缩上下文,实现百万 token 级无损召回
用可写的神经记忆替代外挂 RAG,Titans 在推理阶段动态更新 MLP 权重,以线性成本把上下文压到 200 万 token 仍保持 90% 以上召回。
拆解 Titans 记忆模块:如何用「神经长期记忆+短期上下文」在推理阶段实现百万 token 级上下文无损召回
从惊奇度写入到动量遗忘,详解 Google Titans 如何在推理阶段动态维护一个可更新的 MLP 记忆体,把上下文窗口推至 200 万 token 仍保持 90%+ 召回,并给出可直接落地的超参卡与工程 checklist。
RustFS 零拷贝路径:4 KB 对象 S3 吞吐做到 MinIO 的 2.3 倍
拆解 RustFS 如何通过 io_uring+RDMA 零拷贝与 lock-free 索引,把 4 KB 小对象 GET 吞吐推到 41 GB/s。
拆解 Google Titans 的长程记忆层:如何在 2M token 上下文里保持亚线性显存增长并仍支持单卡推理
深度解析 Titans 的 Neural Long-Term Memory Module,给出显存≈O(log n) 的工程推导与单卡 2M token 实测配置。
拆解 Titans 记忆架构:用长期神经记忆层替代 KV-cache 实现百万 token 级上下文
Google Titans 通过神经长期记忆模块替代 KV-cache,实现线性复杂度下的 200 万 token 处理,拆解其 surprise 机制、集成范式与工程参数。
Google Titans 架构:神经长期记忆模块实现 2M token 线性推理成本
拆解 Titans 如何通过深度 MLP 记忆单元、惊喜指标与在线元学习,在仅 1.8× 算力增幅下将上下文窗口扩至 200 万 token 并保持推理成本线性增长。
Titans 神经长记忆模块:存储-衰减机制与 Rust 插拔实现模板
拆解 Google Titans 架构中 NLTM 模块的惊喜写入与权重衰减机制,提供可插拔的 Rust 代码模板及工程落地参数与监控要点。
从 Jupyter 原型到生产部署:工程化 LLM 代理的 RAG、工具调用与评估实践
基于 AI Engineering Hub,提供 LLM 代理从 Jupyter 原型到生产管道的工程化参数、工具调用配置、评估指标与部署清单。
CATL 电动集装箱船动力系统:MW级LFP/钠离子电池快充与DC微电网集成
针对集装箱船电动化,给出MW级磷酸铁锂/钠离子电池组、超快充参数、DC微电网架构、推进器集成及热管理工程化要点与监控清单。