首页 › 2025年 › 10月 › 多租户 LLM 服务中的 Tensor Core 调度与内存带宽分区优化
2025年10月03日 ai-systems

多租户 LLM 服务中的 Tensor Core 调度与内存带宽分区优化

探讨在多租户 LLM 服务中,通过 Tensor Core 调度和内存带宽分区最大化 GPU 利用率,减少空闲周期的具体工程参数和监控要点。

内容加载中...