首页 › 2025年 › 10月 › 为SWE-Grep设计RL奖励函数:使用相似度阈值和去重指标优化多轮代码检索
2025年10月17日 ai-systems

为SWE-Grep设计RL奖励函数:使用相似度阈值和去重指标优化多轮代码检索

探讨RL奖励函数在SWE-Grep多轮代码检索中的设计,强调相似度阈值和去重指标的应用,以实现低延迟的高效检索。

内容加载中...