Memori:AI代理的分层记忆引擎
Memori通过SQL-native分层记忆架构,为LLM/AI代理提供短/长期记忆层,支持embedding-like检索、多代理共享及高效更新查询操作。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
Memori通过SQL-native分层记忆架构,为LLM/AI代理提供短/长期记忆层,支持embedding-like检索、多代理共享及高效更新查询操作。
工程剖析 TPU ICI/OCS 3D torus 高效 scaling 与 GPU NVLink/InfiniBand 瓶颈,揭示生态锁定下 Google 集群 TCO 优化与长期 AI 竞赛定位参数。
Rust 新提案引入多态移动表达式,支持条件分支下的所有权转移,无需临时分配或 pinning,提供工程化参数与落地清单。
剖析 GPL copyleft 在 AI 模型训练与蒸馏中的传播理论,评估嵌入机制风险,并给出 v2/v3 条款下衍生模型合规清单。
针对地理分布式系统分区场景,阐述准入写读机制与领导者租约调优要点,提供参数阈值、监控清单与回滚策略。
剖析 ?? 在嵌套访问、条件链与默认逻辑中的常见滥用模式,提供类型安全检查清单与运行时监控参数,提升代码鲁棒性。
Tracy 通过 per-thread 无锁 SPSC 环形缓冲区实现多线程低开销帧捕获、CPU/GPU 采样剖析,支持实时遥测无暂停执行,提供缓冲配置、溢出监控等工程参数。
SaaS 泄露后零信任恢复实践:凭证 24h 自动化轮换、日志不可变管道构建、供应链依赖 pinning 参数与监控要点。
详解 Linux 输入从内核 evdev 事件经子系统到 X11/Wayland 的协议细节与工程参数。
希捷最新HAMR原型单碟达6.9TB,提供激光热辅助写入参数、介质优化与可靠性工程要点,助力面密度突破至1.5Tb/in²。
剖析 Quake 引擎的实时性能指示器系统,包括低 FPS、缓存驱逐、磁盘加载和网络延迟的渲染实现与工程化优化。
骁龙8 Elite发布当日即提供上游Linux内核支持,聚焦设备树叠加层、驱动补丁验证及引导链优化参数与监控要点。
TrendRadar聚合35平台热点,利用MCP协议集成13种AI分析工具,实现趋势追踪、情感分析与相似检索,支持Docker部署与多渠道推送。
利用 mkslides 实现 Markdown 到 Reveal.js 幻灯片的 MkDocs-like 工作流:live-reload 预览、自定义主题与插件、静态部署参数。
针对亿级向量低延迟 ANN 检索,Milvus 云原生架构通过 HNSW/IVF-PQ 索引结合分片与查询分布,提供可扩展参数配置与监控清单。
Runprompt CLI 工具详解:通过 .prompt 文件实现 LLM 提示模板的变量替换、模型路由、结构化输出与链式调用,支持工程化 prompt 管理。
对比TPU systolic array与GPU tensor cores在HBM带宽与功率效率的优势,剖析Google长期AI训练的工程参数与扩展策略。
剖析 TPU 脉动阵列在稠密矩阵乘法中的 HBM 带宽利用与能效优势,对比 GPU 张量核在动态负载下的灵活性与长期训练热功耗挑战,提供集群参数与监控清单。
剖析 ChinaTextbook 项目用单一 Git + LFS 分发超 40GB PDF 教材的技术细节,包括 delta 克隆优化、全球镜像加速及落地参数,避免 HTTP 分发瓶颈。
Go 代码优先的零依赖 AI 代理运行时,实现 shimless 工具调用与并发 context 缓存,支持多代理低延迟协调的参数配置。