首页 › 2025年 › 09月 › DeepSeek-V3.2 稀疏混合专家层设计:动态路由与可扩展训练推理
2025年09月30日 ai-systems

DeepSeek-V3.2 稀疏混合专家层设计:动态路由与可扩展训练推理

探讨 DeepSeek-V3.2 中稀疏 MoE 架构的设计,包括动态路由机制、专家激活策略,以及在训练和推理中的工程参数与效率优化要点。

内容加载中...