rl

人工智能

耗时两年，谷歌用强化学习打造23个机器人帮助垃圾分类

强化学习（RL）可以让机器人通过反复试错进行交互，进而学会复杂行为，并随着时间的推移变得越来越好。之前谷歌的一些工作探索了 RL 如何使机器人掌握复杂的技能，例如抓取、多任务学习，…

4326
2023年7月17日
000
人工智能

系统回顾深度强化学习预训练，在线、离线等研究这一篇就够了

近年来，强化学习 (RL) 在深度学习的带动下发展迅速，从游戏到机器人领域的各种突破，激发了人们对设计复杂、大规模 RL 算法和系统的兴趣。然而，现有 RL 研究普遍让智能体在面对…

7033
2023年7月16日
000