首页 › 2025年 › 11月 › 当模型操纵流形:Transformer如何用几何方法解决计数难题
2025年11月03日 ai-systems

当模型操纵流形:Transformer如何用几何方法解决计数难题

从微分几何视角揭示Transformer在计数任务中的深层机制:字符计数如何在高维空间中形成特征流形,注意力头如何通过几何变换实现边界检测,以及这一发现对理解神经网络几何结构的重要意义。

内容加载中...