是否有人在不使用开放式AI体育馆的情况下拥有或知道任何可以教授q学习的教程/课程。我正在尝试建立卷积q学习模型,并且使用pytorch和开放式AI健身房轻松做到这一点没有问题!但是当我尝试将其全部应用到不在开放式AI健身房中的环境中却完全不同时,尝试将其应用到非Atari的其他游戏中,这样我就无法访问env.reset和所有这些其他不错的选择,它变成了一个全新的球类游戏。如果有人知道一个学习的地方,或者愿意教我/帮助我的人,我也愿意为任何帮助付出代价。谢谢。
您可以使用环境代码(例如游戏),然后实现算法。
但是请考虑在代码中明确表述奖励和行动。为每个动作返回奖励。
[如果您想在不使用Gym的情况下启动RL。尝试做一个简单的游戏并实现NEAT算法。然后尝试实施Q学习并修改您的代码以为每个操作添加奖励。