首页 › 2025年 › 09月 › 能量基Transformer:用能量函数替换Softmax实现稳定注意力机制
2025年09月14日 ai-systems

能量基Transformer:用能量函数替换Softmax实现稳定注意力机制

在Transformer注意力机制中,用能量函数取代Softmax可提升梯度稳定性和长上下文建模效率,提供PyTorch自定义层实现与优化参数。

内容加载中...