该研究论文已于 2019 年 10 月 15 日提交在预印本平台 arXiv,并在今年 2 月 11 日进行了最新修订,名为《SEED RL:具有加速的集中推理功能的可扩展且高效的 Deep-RL(SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference)》 … 为了评估 SEED RL,谷歌研究团队在常用的 Arcade 学习环境、几种 DeepMind 实验室环境和谷歌足球环境中,对 SEED RL 进行了基准测试 … 在研究人员看来,SEED RL 和提交的测试结果表明,在利用加速器方面,强化学习再次超越了深度学习的其他领域。