首页 › 2025年 › 09月 › 在 Qwen3-Next 中实现稀疏 MoE 层与混合精度操作的工程实践
2025年09月12日 ai-systems

在 Qwen3-Next 中实现稀疏 MoE 层与混合精度操作的工程实践

基于 Qwen3-Next 的 MoE 架构,探讨 kernel fusion 和混合精度 ops 的多 GPU 优化策略,实现高效训练与亚秒级推理。

内容加载中...