首页 › 2025年 › 09月 › DeepSeek-V3.2-Exp 中稀疏 MoE 层的工程化:高效训练与低延迟推理的动态专家路由
2025年09月29日 ai-systems

DeepSeek-V3.2-Exp 中稀疏 MoE 层的工程化:高效训练与低延迟推理的动态专家路由

基于 DeepSeek-V3.2-Exp 的稀疏 MoE 架构,探讨动态专家路由在长上下文场景下的工程优化参数与监控策略。

内容加载中...