Milvus GPU 加速 ANN 搜索:CUDA 内核集成与 HNSW-IVF 混合索引优化
面向亿级向量规模,集成 Milvus GPU 加速与 CUDA 内核,实现亚毫秒 ANN 查询,使用 HNSW-IVF 混合索引平衡召回与速度。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
面向亿级向量规模,集成 Milvus GPU 加速与 CUDA 内核,实现亚毫秒 ANN 查询,使用 HNSW-IVF 混合索引平衡召回与速度。
基于 Ned 编辑器,探讨 ImGui 中 GLSL 着色器的集成,实现 GPU 加速文本操作、retro 效果和语法高亮,提供 C++ 应用中的工程参数与最佳实践。
工程化无掩模光刻工具,用于高通量芯片图案化,消除光掩模以降低成本并启用半导体制造中的动态设计变更。
面向 Miele 家电诊断,给出 FreeMDU 开源工具的协议解码、USB 接口集成与实时监控的参数配置。
reSIProcate 是一个高效的 C++ 库,支持 SIP、ICE 和 TURN 协议的实现,通过异步 I/O、压缩和零拷贝缓冲实现 VoIP 与 WebRTC 的低延迟实时通信。
探讨在 C# 中构建宽松许可的 PDF 库,聚焦核心渲染、解析和操作 API,避免 GPL 依赖以支持商业应用。推荐 MigraDoc 和 PDFSharp 组合,提供工程化实现要点。
针对 GCC 默认 C++ 标准转向 C++20,提供自动化工具链迁移策略,包括弃用特性兼容垫片设计,以及遗留 C++17 项目中的渐进式集成参数与监控要点。
利用 C++ 构建高效 Minecraft 协议栈,涵盖异步网络 I/O、压缩优化及零拷贝序列化技巧,实现低延迟服务器交互。
基于 WAL 逻辑解码插件,在 Postgres 分片环境中实现实时分布式事务协调,包括 2PC 模拟和时间戳向量冲突解决,提供工程参数与监控要点。
通过 Docker 部署 TrendRadar,实现 35 平台热点聚合、AI 趋势与情感分析,以及 WeCom、Flybook 等多渠道通知的工程化设置,1 分钟内完成快速上线。
通过 CDP 命令编辑器动态合成和执行协议命令,支持 WebSocket 会话实时调试和自定义事件注入,避免静态 JSON 脚本。
LightRAG 通过双图结构实现零-shot 实体提取与递归检索,支持 LLM 管道中高效 RAG,无需传统向量搜索。
利用 Tracy 实现低开销多线程性能分析,针对 C++ 游戏引擎的帧捕获与瓶颈定位,提供集成参数与监控策略。
基于 LibrePods 项目,探讨在非苹果生态中实现 AirPods 高级功能的开源 Bluetooth 驱动,包括协议解析、电池监控和多设备无缝重连的工程参数与实施指南。
在 LightRAG 框架中引入分层实体关系图,支持多跳查询的递归检索,实现比平面图低 30% 的延迟。详述工程参数、阈值设置与监控策略。
针对2000年赛车模拟游戏在高主频多核CPU上的崩溃,通过逆向分析时序和API问题,提供调试参数与兼容性策略。
在连续介质力学模拟中,利用快速傅里叶变换将时域机械波方程分解为频率谱,实现线性偏微分方程的高效数值求解,提供工程参数与实现要点。
通过 CDP 命令编辑器,构建自定义命令用于浏览器仪器化、自动化脚本和实时调试,提供工程化参数与最佳实践。
面向分布式Unix系统,给出runit服务监督的工程化配置、进程隔离与重启策略。
利用 LightRAG 的双实体-关系图实现无嵌入 RAG 管道,支持递归检索和 LLM 增强,在低资源环境中比传统向量搜索快 2 倍。