openai-gym 相关问题

OpenAI Gym是一个强化学习研究平台,旨在为各种环境提供通用智能基准。

TRPO-RL:我需要获得一个8自由度的机械手才能移动到指定点。我需要在凉亭环境中使用OpenAI Gym来实现TRPO RL代码吗?

TRPO-RL:我需要一个8自由度机械手来移动指定点。我需要使用OpenAI Gym来实现TRPO RL代码。我已经有了凉亭环境。但是我不确定如何写...

回答 1 投票 -1

带有定制模型的矢量信封

我一直在这里和这里阅读如何在SubProcVenv模块中使用矢量化环境。但是我可以找到的所有示例都使用稳定的基线(openai的模型),而我无法...

回答 1 投票 0

如何基于另一个割炬张量中的索引来更改割炬张量中的某些值?

这是我在将刀DQN转换为Double DQN时遇到的问题。我快要弄清楚了。张量([0.1205,0.1207,0.1197,0.1195,0.1204,0.1205,0.1208,0.1199,...]

回答 1 投票 1

我如何基于另一个割炬张量中的索引来更改割炬张量中的某些值?

这是我在将刀DQN转换为Double DQN时遇到的问题。我快要弄清楚了。张量([0.1205,0.1207,0.1197,0.1195,0.1204,0.1205,0.1208,0.1199,...]

回答 1 投票 0

健身房2d(openAI)未能成功安装(pip错误)

[我正在尝试使用OpenAI进行以下代码:import Gym env = gym.make('CarRacing-v0')env.reset()for _ in range(1000):env.render()env.step( env.action_space.sample()),但会引发错误:...

回答 1 投票 2

RL环境-OpenAI Gym Taxi-v2 vs Taxi-v3

健身房出租车-v2为折旧。我的Q学习工具仍可与Taxi-v3配合使用,但是对于某些重新使用环境,env.render()在每个步骤都显示错误的滑行位置。无论如何,除了增加的墙外,什么是...

回答 1 投票 0

AttributeError:“模块”对象在通过OpenAI Gym运行Box2d时没有属性“ RAND_LIMIT”

我已经使用pip install安装了box2d,但是当我使用python为box2d游戏运行OpenAI健身房环境时。以我为例,我正在尝试运行LunarLander环境:-import Gym env = gym.make(“ ...

回答 1 投票 1

稳定基线的熵,平均奖励等

我已经通过实现StableBaselines的step,reset和render方法建立了一个自定义环境,但是我不知道如何打印一些图。例如,我的代理人(在...

回答 1 投票 0


如何实时运行和渲染Atari健身房环境,而不是加快速度?

当前,当我渲染任何Atari环境时,它们总是会加速,我想以正常速度查看它们。我在Tensorflow上使用Gym Atari,在Windows上使用Keras-rl。语言是...

回答 1 投票 0

指定OpenAi Gym的渲染窗口大小

调用env.render()总是渲染一个充满整个屏幕的窗口。 env = gym.make('FetchPickAndPlace-v1')eni.reset()for i在范围(1000)中:env.render()

回答 1 投票 3


出现错误:模块'gym'没有属性'make'

我正在尝试运行他们的 OpenAI-gym 官方文档中提供的基本 OpenAI-gym 程序: 进口健身房 env = gym.make("CartPole-v1") 观察= env.reset() 对于 _ 在范围内(1000): 环境

回答 2 投票 0

探索如何在OpenAI Baselines中工作?

我开始尝试https://github.com/openai/baselines/,特别是deepq算法。我想对传递给deepq.learn方法的参数进行自己的分析。 ...

回答 1 投票 0

安装用于OpenAI Gym的Box2D Python软件包时出错

根据本文,我正在尝试在Windows 10中安装OpenAI的Gym。我遵循了大多数步骤,没有出现问题。但是,在通过pip安装Box2D的步骤中,出现以下错误。...

回答 1 投票 0

是否有OpenAI Gym连续环境(除了倒立摆之外)和基线?

我想使用OpenAI Gym解决一个连续的环境,即一个无休止的情节的问题(请注意,我并不是说一个具有连续状态和...的连续环境...]

回答 1 投票 0

具有负值的OpenAi-Gym离散空间

我创建了一个自定义健身环境,其中动作可以是-100到+100之间的任何整数。据我所知,不可能创建允许负值的离散空间,并且...

回答 1 投票 0


OpenAI旋转问题:ImportError:DLL加载失败:找不到指定的过程

阅读OpenAi的“向上旋转”教程系列(https://spinningup.openai.com/en/latest/user/installation.html)。当我尝试打击他们的步骤“ python -m spinup.run ppo --hid“ [32,32]” --env ...

回答 1 投票 1

Matplotlib-如何绘制训练中每个时期的进度?

我正在尝试构建一个能打棍子的深层Q学习代理。通过强化学习,它学会通过移动手推车来平衡斗杆。我的模型有效,但是我不知道如何...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.