首页 › 2025年 › 09月 › Qwen3-Next 中稀疏 MoE 层的实现:混合精度运算与内核融合优化
2025年09月12日 ai-systems

Qwen3-Next 中稀疏 MoE 层的实现:混合精度运算与内核融合优化

探讨 Qwen3-Next 中稀疏 MoE 层的工程实现,包括混合精度运算、内核融合技巧,以及实现亚秒级推理延迟的部署参数。

内容加载中...