OpenAI Gym是一个强化学习研究平台,旨在为各种环境提供通用智能基准。
试图从GoalEnv派生出env。有谁知道为什么永远不会调用这个复位功能? def reset(self):#强制每个GoalEnv使用与目标兼容的观察空间。 ...
我正在尝试使用gym-retro在pyhton 3.6.8中创建一个游戏环境。这是一个稳定的游戏名称Space Invaders-Atari 2600位于“..retro \ data \ stable \”基本命令是:env = retro.make(...
NameError:名称'base'未定义OpenAI Gym
[注意我正在使用xvfb-run -s“-screen 0 1400x900x24”jupyter notebook]我尝试在OpenAI Gym import gym中运行一组基本命令env = gym.make(“CartPole-v0”)obs = env。 reset()env.render()...
如何将Q-learning应用于OpenAI-gym环境,在每个时间段采取多项措施?
我已成功使用Q-learning来解决OpenAI Gym(即Taxi,CartPole)的一些经典强化学习环境。这些环境允许在每个环境中采取单一行动......
我正在尝试在基于Pacman的游戏中使用强化学习。我想使用Q-learning技术来生成我的代理的动作。我打算用openai-gym和keras图书馆训练我...
我对CartPole-v0内省的观察空间感到惊讶。根据官方文档,这是我应该得到的:然而这是我得到的:print(env.observation_space ....
我正在尝试运行vanilla策略梯度算法并渲染Open AI环境“CartPole-v1”。下面给出了算法的代码,运行良好,没有任何错误。 Jupyer ......
我正在尝试安装和设置健身房复古按照本教程https://www.youtube.com/watch?v=CFa6NhLgeL0&list=PLTWFMbPFsvz3CeozHfeuJIXWAJMkPtAdS&index=2但是当我点击安装-e。我明白了......
如何修复整齐的recurrent.py文件,整洁的python库openAI健身房
试图让python整洁的算法与openAI gym retro一起使用。我在youtube上使用python3:https://www.youtube.com/watch?v = 8dY3nQRcsac&list = PLTWFMbPFsvz3CeozHfeuJIXWAJMkPtAdS&...
无法为cmake安装gym-retro:subprocess.CalledProcessError
这是另一个pip安装错误(那些让我发疯的事)。我在Windows 8.1上使用python 3.7。我试图通过pip安装健身房复古(我已经安装了健身房)并且一直遇到......
我已经'成功'建立了一个Q-network来解决OpenAI健身房的'FrozenLake-v0'环境(至少,我认为..不是100%肯定我的得分 - 我在100个成功剧集中得到70到80个5k之后......
所以我想第一次实现一个针对smartcab问题的强化学习算法,但是当我安装健身房库时,存在一个问题(平台:Windows 10)使用的CL:...
我被赋予了设立openai玩具健身房的任务,只能由有记忆的经纪人来解决。我已经得到了一个有两扇门的例子,在时间t = 0时,我显示为1或-1。在t = 1我...
gym.make('CartPole-v0')返回什么以及它如何工作?
我知道env = gym.make('CartPole-v0')的类型为gym.wrappers.time_limit.TimeLimit我也知道env是类cartpole.py的“实例”。我的问题是如何通过命名'CartPole-v0'...
我正在尝试使用复古模块和我jupyter笔记本,我似乎安装它与!pip安装复古通过下载/安装确定。但是当我尝试导入复古时我得到一个错误...
我正在尝试在本文中实现DeepMind引入的Deep Q Learning算法:https://arxiv.org/pdf/1312.5602.pdf我正在使用它来创建一个学习玩Pong的代理,但它... 。
如何在OPEN AI Universe中创建新环境以使用我的网站执行操作?我试过DUSK GAME。它运作良好。
我按照OpenAI Gym的安装说明进行操作,但完整安装会出现错误“无法为mujoco-py构建轮子”pip安装健身房并在我的笔记本电脑上导入健身房工作正常并导入...
为什么OpenAI Gym Atari在渲染时会给出错误的观察?
截图这是env.render()在屏幕上输出的内容,环境是SpaceInvader-v0。我在这里做错了吗?我的代码完全在OpenAI Gym网站上,只是改变了......