Page 359

最新见解 · 第 359 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2025-12-23 ai-systems

vLLM-Omni跨模态注意力算子融合策略设计

针对vLLM-Omni全模态推理框架,设计跨模态注意力与投影层的算子融合策略,通过减少内存带宽与内核启动开销提升多模态模型推理性能。

阅读全文 →