首页 › 2025年 › 11月 › LPLB:基于线性规划的MoE负载均衡器
2025年11月26日 ai-systems

LPLB:基于线性规划的MoE负载均衡器

将MoE token到专家路由建模为线性规划,利用单SM IPM求解器实现动态负载均衡、最小化GPU间排队延迟和高吞吐分布式推理。

内容加载中...