ReFAG 检索工程实现:自适应分块、MinHash 近重复检测与内存高效向量融合
探讨 ReFAG 在长上下文 AI 系统中的工程优化,包括自适应分块策略、基于 MinHash 的去重机制,以及向量融合技术,以提升检索效率和内存利用率。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
探讨 ReFAG 在长上下文 AI 系统中的工程优化,包括自适应分块策略、基于 MinHash 的去重机制,以及向量融合技术,以提升检索效率和内存利用率。
在异步网络应用中,结合select处理小规模fd集与epoll/kqueue应对大规模并发,通过动态切换机制优化吞吐量和延迟,提供工程化参数与监控要点。
针对多租户湖仓查询,介绍 TTL 清单列表缓存与快照过期的实现,降低 50% 元数据延迟。
针对多租户湖仓查询,介绍 Apache Iceberg 的清单列表 TTL 缓存与快照过期机制的参数配置、自动化实现及监控要点,实现元数据延迟降低 50%。
探讨如何将 Lisp 解释器嵌入 shell 环境,实现 POSIX 兼容脚本,包括宏展开、环境变量处理和进程生成的工程参数与实践清单。
针对 Qwen3-VL 多模态 LLM 的长序列视频处理,给出时序注意力机制与令牌压缩的工程参数配置、优化策略与监控要点。
Supermemory 通过混合向量和图索引实现高效的 AI 代理记忆 API,支持实时增量更新和零拷贝共享,适用于边缘部署。文章探讨工程参数、监控要点和落地清单。
在 PostgreSQL 18 中,利用 psql 的 pipelining 功能实现异步多命令执行,显著降低高吞吐量数据库交互的往返延迟,提供参数调优与最佳实践。
探讨 SQLBot 如何通过 RAG 技术实现 schema 检索、复杂查询提示调优、验证层和安全执行,提升 BI 分析效率。
比较select的基本轮询、poll的可扩展文件描述符管理,以及epoll/kqueue在高并发场景下的高效边沿触发通知,提供工程化参数和监控要点。
针对 AI 编码工具的私有数据泄露风险,探讨安全扩展隔离和提示净化策略,提供工程化参数与实施清单。
在 GitHub Copilot 等 AI 编码工具中,通过扩展隔离和提示净化机制,缓解恶意插件与上下文注入导致的仓库数据外泄风险,提供具体工程参数与最佳实践。
利用可验证计算、安全消息传递和任务委托,Coral 协议构建可扩展的 Internet of Agents,详述工程参数与落地策略。
面向 YouTube 字幕在 SurfSense RAG 中的处理,给出分块策略、嵌入模型选择及语义检索优化的工程参数与落地清单。
基于Cubyz项目,探讨Zig语言下多线程chunk渲染,利用Vulkan异步计算队列实现动态LOD和高帧率体素世界,强调屏障同步的关键参数。
在 Web Crypto API 中采用小公钥指数 e=3 优化 RSA 签名验证管道,提升性能同时通过严格填充检查缓解 Bleichenbacher 式攻击,提供工程化参数与监控要点。
探讨如何在 SurfSense 中通过 API 限流避免速率限制、基于嵌入的去重减少冗余,以及 RRF 融合提升多源检索排名,提供工程参数与监控要点。
探讨 PHP 中飞船、空安全和 match 运算符在 web 后端代码中的应用,聚焦迁移挑战、类型安全及遗留系统解析器优化,提供工程化参数和清单。
探索 Rift 项目在 macOS 上实现 bspwm 风格平铺算法的工程细节,包括 API 集成、配置参数和多屏支持要点。
在云端照片应用中设计限流opt-out机制,使用Token Bucket算法控制AI扫描opt-out请求,并集成审计日志确保合规,提供具体参数和实现要点。