生产环境中 RAG 的学习型查询扩展与端到端评估指标实现
本文聚焦生产 RAG 系统中的学习型查询扩展技术实现,包括 LLM 驱动的扩展方法与参数优化;同时介绍端到端评估指标,如上下文精确率、忠实度和事实正确性,用于持续性能监控与迭代。
Page 643
共 16860 篇文章,分类 267 个。
近期的思考与工程笔记。
本文聚焦生产 RAG 系统中的学习型查询扩展技术实现,包括 LLM 驱动的扩展方法与参数优化;同时介绍端到端评估指标,如上下文精确率、忠实度和事实正确性,用于持续性能监控与迭代。
探讨Rust中ripgrep使用的SIMD加速DFA正则匹配引擎,通过向量化和懒惰评估实现大型文件亚毫秒级模式匹配,提供工程参数与监控要点。
在 GPU 池化系统中引入动态调度算法,通过细粒度资源分配和负载均衡,实现 AI 训练中 H100 GPU 使用量减少 82% 的工程实践指南。
Exgen-Malloc 是一种缓存无意识的代际分配器,通过阶段基于堆分区提升单线程应用的局部性,减少 TLB 缺失。文章讨论工程实现参数和监控要点。
探讨 TernFS 在艾字节级存储中的分片机制与分布式索引设计,支持水平扩展与多区域低延迟查询,提供工程参数与最佳实践。
利用 TypeScript 构建多轮 LLM 链式管道,支持流式响应、音频合成和自定义工具集成,实现灵活的播客生成,超越单一笔记本限制。
通过拦截 API 调用和分析行为模式,从 20+ AI 工具中提取系统提示,实现自定义工具集成的模块化代理构建,提供工程参数与监控要点。
基于 SvelteKit 构建支持并发多模型聊天、模型切换和流式响应的模块化 UI,包括插件架构扩展要点。
在 Unix-like 系统上,利用信号和共享内存实现简单高效的消息队列,确保有序传递和可靠交付,提供工程化参数和实现清单。
EloqDoc 通过对象存储作为持久层,提供 MongoDB 兼容的分布式文档数据库,优化耐久性和成本,支持 schema-flexible 分片和最终一致性。
基于 Micrograd 的纯 Python 实现,探讨 scalar autograd 如何通过 Value 列表模拟向量化操作,并利用拓扑排序实现高效 backprop,支持简单神经网络的训练参数与 API 设计。
基于 PaddleOCR 开发高效 OCR 系统,从 PDF 和图像中提取结构化数据,支持多语言文本检测与识别,便于集成到 LLM 工作流中。
Async Rust promises memory safety without data races, but what happens when the safety guarantees themselves become a subtle hazard? This deep dive explores "futurelock," a counterintuitive deadlock pattern where safe Rust code can still hang indefinitely.
基于 Claude Cookbook,利用 Jupyter notebooks 工程化模块化提示模式和工具集成,实现可重现的 AI 工作流和智能代理应用。包括提示模板设计、工具调用参数及 agentic 工作流优化要点。
探讨 ripgrep 在大型代码仓库中的工程实现,聚焦 Rust 并行正则匹配、gitignore 集成与二进制文件检测机制,提供亚秒级搜索的参数配置与优化策略。
基于 Tauri 的 Judo GUI 为 Jujutsu VCS 提供可视化操作,支持操作日志、合并差异和拖拽重基等功能,优化开发工作流。