首页 › 2025年 › 10月 › Fish Speech 中非自回归扩散 Transformer 的工程实现:并行多语言 TTS 生成、VQ-VAE 标记化和边缘低延迟合成
2025年10月23日 ai-systems

Fish Speech 中非自回归扩散 Transformer 的工程实现:并行多语言 TTS 生成、VQ-VAE 标记化和边缘低延迟合成

探讨 Fish Speech 中 DiT 架构的工程实践,支持并行多语言 TTS、VQ-VAE 令牌化和 RTF <0.2s 的低延迟合成。

内容加载中...