Hotdry.
所有分类

ai-systems

机器智能

LEANN查询重写与索引压缩协同优化算法

深入解析LEANN系统中查询重写算法与向量索引压缩的协同优化机制,在保持97%存储节省的同时提升RAG查询精度与响应速度的工程实现方案。

阅读全文 →

vLLM-Omni跨模态注意力算子融合策略设计

针对vLLM-Omni全模态推理框架,设计跨模态注意力与投影层的算子融合策略,通过减少内存带宽与内核启动开销提升多模态模型推理性能。

阅读全文 →
11 / 55 页 · 共 4393