首页 › 2025年 › 09月 › Dynamic Expert Routing in DeepSeek-V3.2 MoE for Low-Latency Multi-User Inference
2025年09月30日 ai-systems

Dynamic Expert Routing in DeepSeek-V3.2 MoE for Low-Latency Multi-User Inference

探讨 DeepSeek-V3.2 MoE 模型的动态专家路由实现,针对多用户场景优化负载均衡与 token 吞吐量,提供工程参数与监控要点,实现低延迟高效推理。

内容加载中...