首页 › 2025年 › 10月 › 调优 UTF-8 规范化阈值以提升分词器对海马表情符号的鲁棒性
2025年10月06日 ai-systems

调优 UTF-8 规范化阈值以提升分词器对海马表情符号的鲁棒性

针对海马表情符号引发的 OOV 峰值和不稳定输出,讨论在 LLM 分词器中添加多字节解码回退和规范化阈值调优的工程实践。

内容加载中...