首页 › 2025年 › 10月 › 动态张量重排与微批处理:实现多租户LLM服务中的100% GPU利用率
2025年10月03日 ai-systems

动态张量重排与微批处理:实现多租户LLM服务中的100% GPU利用率

基于CRFM Splinter的硬件优化策略,聚焦动态张量重排和微批处理在多租户LLM推理中的应用,提升GPU利用率至近100%,并给出工程参数与风险控制。

内容加载中...