首页 › 2025年 › 10月 › 优化LLM推理的可插拔分块:张量分区策略与参数调优
2025年10月25日 ai-systems

优化LLM推理的可插拔分块:张量分区策略与参数调优

通过动态张量分区实现零模型修改的LLM推理加速,详解分块阈值、缓冲区管理及吞吐量监控方案。

内容加载中...