首页 › 2025年 › 10月 › 欺骗分词器:字符级对抗攻击如何绕过LLM的安全防线
2025年10月14日 ai-systems

欺骗分词器:字符级对抗攻击如何绕过LLM的安全防线

大型语言模型(LLM)的安全性不仅取决于语义理解,更隐藏在字符处理的底层细节中。本文揭示了利用Unicode和编码技巧进行字符级对抗攻击的机制、风险及其在工程实践中的防御策略。

内容加载中...