LightRAG 查询融合蒸馏管道:双图索引下的高效检索优化
LightRAG 通过双本地-全局图索引与查询融合蒸馏管道,实现 LLM 调用减少 50%,同时提升召回率与响应速度,提供工程阈值参数与落地清单。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
LightRAG 通过双本地-全局图索引与查询融合蒸馏管道,实现 LLM 调用减少 50%,同时提升召回率与响应速度,提供工程阈值参数与落地清单。
Qwen3-VL 通过 interleaved MRoPE、DeepStack 和文本时间戳,实现2小时视频(约100万token)的高精度细节定位,提供部署阈值、监控清单与回滚策略。
剖析MEMS、Flash、OPA三种波束转向技术在汽车LiDAR中的应用,结合点云去噪与多传感器融合管道,实现100-500m实时ADAS感知的关键参数与落地清单。
Tracy profiler 通过 lock-free MPSC 队列实现零拷贝帧数据传输,支持游戏引擎多线程高性能剖析,开销控制在纳秒级,提供可落地集成参数与监控清单。
通过API一键触发AI代理拨打电话,或配置号码直连bot,实现实时ASR/TTS客服管道。详解参数配置、部署清单与监控要点。
Zig 新 async 计划聚焦单线程事件循环协程调度、挂起 poll 优化,提供低延迟网络服务工程参数与监控要点。
利用 Code Wiki 的知识图谱构建、语义搜索嵌入和多文件上下文管理,加速 monorepo 代码理解的工程参数与实践清单。
DiskANN 磁盘索引结合混合多向量搜索与 Kubernetes 分片,实现亿级嵌入的高效 ANN 检索,附参数调优与运维清单。
WSABuilds 项目提供 Win10/11 上即用型 WSA 镜像,内置 Magisk/KernelSU root 与 MindTheGapps GApps,无需手动内核补丁或侧载 GApps,实现一键部署 Android 子系统。
通过开关电容转移电荷实现高效低压降电压减半,分析电容匹配、开关时序与寄生影响,提供工程化参数与实现清单。
解析 Claude 4.5 Opus Soul Document 如何实现内部自省状态持久化,提供跨对话记忆的工程参数、监控阈值与落地清单,提升长上下文任务稳定性。
Trainium3 通过 3nm 工艺、FP8 精度、Neuron 编译器融合运算及 Trn3/P5 集群扩展,实现较 Trainium2 4 倍 LLM 训练加速,提供工程参数与监控清单。
VERL PPO中KL divergence阈值的工程化调优,平衡训练稳定与模型性能提升。
基于 KOI 报告逆向 ShadyPanda 扩展后门的 chrome.storage.sync 持久化、小时级 C2 轮询及开发者工具检测规避,提供企业浏览器监控阈值、检测规则与清理清单。
TypeScript 7 原生预览版通过增量分析重构和共享内存并行,实现编译速度10倍提升,详解落地参数、监控要点与迁移清单。
Anthropic 收购 Bun,将 Zig 构建的高性能 JS 运行时深度集成 AI 栈,提供 agent 工具链、无服务器推理与 WebSocket 流式输出的工程参数、阈值与监控要点。
通过 WAL 模式、索引、ANALYZE 和关键 PRAGMA 参数,SQLite 单表十亿行轻松实现 10 万 TPS 混合读写,避开 ORM 直击极致吞吐,适用于单机高性能场景。
单机 SQLite 通过 WAL、索引、ANALYZE 和 PRAGMA 参数,在十亿行表上实现 10 万 TPS 混合读写,避开 ORM 直击极致吞吐。
单机 SQLite 通过 WAL、索引优化和 PRAGMA 参数,在十亿行表上轻松实现 10 万 TPS,远超网络数据库,适用于高吞吐读写场景。
基于 Google ADK-Go 工具包,详解 Go 并发驱动的并行代理评估、自定义基准测试集配置,以及 session checkpoint 保障的可靠部署参数与监控清单。