Milvus 中使用混合索引(HNSW/IVF)实现亿级实时向量 ANN 搜索的工程实践
探讨 Milvus 中混合 HNSW 和 IVF 索引的工程实现,结合 RocksDB 和 Pulsar 的分布式查询路由,支持亿级规模实时检索的关键参数与优化策略。
Page 539
共 16860 篇文章,分类 267 个。
近期的思考与工程笔记。
探讨 Milvus 中混合 HNSW 和 IVF 索引的工程实现,结合 RocksDB 和 Pulsar 的分布式查询路由,支持亿级规模实时检索的关键参数与优化策略。
通过 Encore 框架,在 Go 代码中声明 API 和基础设施,实现类型安全分布式系统开发,避免手动配置运维。
在每个 PR 上自动化运行 RegreSQL 测试,检测查询正确性和性能回归,并配置失败警报与基线更新机制。
聚焦 VERL 框架下离线 RLHF 数据 curation 的工程实践,包括样本选择阈值、过滤策略与偏置缓解参数。
针对 PlayCanvas 引擎,详解 WebGL 到 WebGPU 的 shader 翻译、渲染管线迁移及 glTF 优化参数,实现高效跨浏览器 3D 加速。
通过自定义 RegreSQL 的 diff 算法,使用成本阈值和计划形状相似性来精确检测查询回归,避免对优化器良性变化的过度警报,提供工程化参数和实现指南。
在高吞吐 JavaScript 应用中,探讨 V8 Orinoco GC 的并发标记和清除阶段如何最小化暂停时间,提供参数配置与监控要点。
探讨 V8 垃圾回收中的增量标记技术,通过对象分类和写屏障实现低延迟 JavaScript 运行时。提供工程参数和监控要点,帮助优化并发 Web 应用性能。
评估 Polars、DuckDB、Daft 和 Spark 在 650GB S3 Delta Lake 数据上的性能,聚焦查询延迟、内存使用和扩展性,为大数据分析管道提供单节点优化建议。
探讨使用 ADK-Go 进行代码优先的 AI 代理开发,聚焦模块化工具集成、状态持久化和灵活控制流的设计,实现复杂代理编排而无需繁重配置。
探讨 VERL HybridFlow 在多 GPU 环境下的分片策略、RDMA 聚合机制,以及针对离线 RLHF 的容错优化,实现万亿参数 LLM 对齐的低延迟 all-reduce。
在 Memori 框架下,探讨如何通过 SQL 与向量嵌入的混合存储实现 LLM 代理的可扩展长上下文记忆,针对边缘设备优化查询延迟至 100ms 以内,包括关键参数和监控要点。
探讨Tweeks浏览器扩展中规则-based内容过滤和实时DOM变异API的工程实现,用于动态移除广告、跟踪器和杂乱内容,提供更干净的浏览体验。包括参数配置、监控要点和潜在风险。
面向古罗马道路数字图集,给出 Web GIS 平台的工程实现,包括数据整合、矢量瓦片生成与交互查询的参数与最佳实践。
工程化 PostgreSQL 查询计划差异比较与自动化警报,检测 schema 变更和升级中的性能回归,提供落地参数。