首页 › 2025年 › 10月 › 动态环境中epsilon-greedy与UCB bandit算法的regret分析与优化策略
2025年10月01日 ai-systems

动态环境中epsilon-greedy与UCB bandit算法的regret分析与优化策略

针对动态环境下的多臂老虎机问题,深入分析epsilon-greedy和UCB算法的regret表现,并提出自适应参数调整策略。

内容加载中...