openai-gym 相关问题

OpenAI Gym是一个强化学习研究平台,旨在为各种环境提供通用智能基准。

强化学习--当游戏的输入只有像素时,我们如何决定对代理的奖励?

我是RL新手,我做得最好的是openAI gym中的CartPole。在CartPole中,API会自动提供给定动作的奖励。我如何决定奖励,当我有......。

回答 1 投票 0

无法将 pytorch 安装到我的 anaconda 虚拟环境中。

我正在遵循OpenAI的spinningUp教程,我卡在了项目的安装部分。我使用的是Anaconda,当我这样做:Pip install -e 。它给出了以下错误:...

回答 1 投票 0

从地图数据创建OpenAI健身房环境

我刚刚开始使用强化学习,并试图使用OpenAI gym创建一个自定义环境。然而,我在尝试创建一个环境(有道路和交叉口)时陷入了困境......。

回答 1 投票 0

健身房环境如何恢复之前的状态

我试图在Openai的atari健身房环境中实现MCTS,这需要计划的能力:在环境中行动并将其恢复到以前的状态。我读到可以用 ...

回答 1 投票 0

如何确认OpenAI gym环境中可用的动作?

在使用OpenAI gym时,用import gym导入库后,可以用env.action_space检查动作空间。但这只给出了动作空间的大小。我想知道的是...

回答 1 投票 0

ImportError:无法从'roboschool'导入名称'cpp_household'

请帮助我。我无法导入lib roboschool 1.0.49 Gym == 0.15.4输入导入roboschool输出D:\ Users \ gumin \ anaconda3 \ python.exe D:/ Users / gumin / anaconda3 / Lib / site-packages / roboschool / test。 py ...

回答 1 投票 0

如何解决OpenAI Gym中的“找不到Env”错误?

我正在使用Gym版本-'0.9.7'和mujoco_py版本1.50.1.41,Python 3.6.1 | Anaconda 4.4.0,安装在Mac上。尝试时:import gym env = gym.make('Humanoid-v1')我得到以下信息...

回答 1 投票 3

来自OpenAI基线的LazyFrames如何节省内存?

OpenAI的基线使用以下代码返回LazyFrames而不是串联的numpy数组以节省内存。这个想法是利用了一个事实,即可以在...

回答 1 投票 1

在openai体育馆中创建自定义环境,以游戏画面为观察依据

我已经使用PyGame制作了游戏。我想使用游戏屏幕的输出作为观察的习惯,而不是一组距离和角度。 (我看过用于自定义文档的文档...

回答 1 投票 0

有没有一种方法可以实现OpenAI的环境,在该环境中,操作空间在每个步骤上都会发生变化?

有没有一种方法可以实现OpenAI的环境,每个动作空间在每个步骤都会改变?

回答 2 投票 2

如何使用OpenAi-Gym和Scoop产生可再现的随机性?

如何使用OpenAi-Gym和Scoop产生可再现的随机性?每次重复该示例时,我都希望得到完全相同的结果。如果可能的话,我希望它可以与现有的库一起使用...

回答 1 投票 0

自定义OpenAi Gym Taxi v2环境

我想在开放式AI体育馆中修改出租车V2-环境。在我到达目的地之前,是否可以接载2位乘客。

回答 1 投票 0

在OpenAI健身房的classic_control环境中无法更改模型参数

我正在使用CartPole-v1环境,正在尝试更改某些模型参数(例如force_mag),以测试带有模型变化的算法的稳健性。我是...

回答 1 投票 0

健身房的自定义环境错误:无法重新注册ID

我想创建自己的健身环境。我已按照此处说明的步骤进行操作:https://github.com/openai/gym/blob/master/docs/creating-environments.md。根据他们的建议,我创建了...

回答 1 投票 0

ImportError:无法导入名称'SkipWrapper'

我正在使用Gym Open AI处理此AI代码。所以我试图导入这个包装器,并且得到这个ImportError。导入numpy作为np导入火炬导入torch.nn作为nn导入torch.nn。功能为...

回答 1 投票 2

Openai的PPO2模型在通过我的自定义环境(Python)时返回NANs

我制作了以下自定义环境:Market(gym.Env)类:“”“此环境用于使用OpenAI健身房强化学习算法来训练BUYING vwap殴打算法”“”“元数据= ...

回答 1 投票 0

是否可以在OpenAI健身房中获取环境图像?

[在像Atari太空入侵者的环境中,环境的状态就是它的图像,因此在下面的代码观察行中,动作,奖励,_ = env.step()观察变量保存着实际的图像...

回答 1 投票 0

在Openai体育馆中避免违法行为

我正在尝试为模拟问题提供一个体育馆环境。在我的体育馆环境中,我有一系列非法状态,我不希望我的经纪人进入这些状态。添加这样的最简单的方法是什么...

回答 1 投票 0

rllib使用自定义注册环境

Rllib文档提供了有关如何创建和训练自定义环境的一些信息。关于注册该环境有一些信息,但是我想它需要与健身房不同地工作...

回答 1 投票 1

使用健身房的OpenAI是否可以减慢游戏环境?

[当我在健身房渲染环境时,它玩游戏的速度如此之快,以至于看不到发生了什么。代码应该没有问题,因为我尝试了很多不同的代码。

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.