openai-gym 相关问题

OpenAI Gym是一个强化学习研究平台,旨在为各种环境提供通用智能基准。

稳定基线 3 在剧集被截断时抛出 ValueError

因此,我尝试通过 stablebaselines3 在我的自定义体育馆环境中训练代理,但它似乎总是随机崩溃并抛出以下 ValueError: 追溯(最近一次调用...

回答 1 投票 0

我的图书馆gym无法导入到jupyter笔记本

为什么我在jupyter笔记本中导入gym,没有名为“gym”的模块???我已经有了环境并成功安装了gym,但是当我尝试导入时没有模块 在此输入图像描述 我

回答 1 投票 0

体育馆/宠物动物园:让 Tic Tac Toe 显示 ansi 文本

使用 Tic Tac Toe 环境: 从 pettingzoo.classic 导入 tictactoe_v3 env = tictactoe_v3.env(render_mode="ansi") 环境重置(种子=1) 环境步骤(1) 打印(env.render()) 这输出...

回答 1 投票 0

为什么不同种子的破发环境是一样的?

导入gymnas作为gym 将 numpy 导入为 np 对于 [0,1,2,3,4] 中的 s: env=gym.make("BreakoutNoFrameskip-v4") 观察,info = env.reset(seed=s) 打印(s,np.sum(观察)) 我

回答 1 投票 0

Python Gymnasium 渲染被强制

我是健身房的新手,我尝试做一个简单的qlearning程序,但由于某些(奇怪的)原因,它不会让我摆脱渲染部分(这需要永远)...... 这是我的程序: 进口健身房...

回答 1 投票 0

Q 学习代理为达到目标采取了太多步骤

我目前正在为 OpenAI Gym 中的 FrozenLake-v1 环境实施 Q-learning。然而,我的经纪人似乎喜欢采取很多不必要的步骤来达到目标。我已经审查过...

回答 1 投票 0

有办法改变超级马里奥兄弟(NES)1级世界1的寄存器以从特定位置开始吗?

我一直在使用gym-super-mario-bros库(https://github.com/Kautenja/gym-super-mario-bros),我试图更改寄存器的值以设置马里奥对特定角色的定位...

回答 1 投票 0

无法通过 Gymnasium 导入 Atari 环境

我正在尝试使用 ALE 来测试 Atari 游戏与体育馆。我正在使用下面的代码来创建 Breakout 环境。 将体育馆导入为健身房 env =gym.make('ALE/Breakout-v5') 完成=假 虽然没有...

回答 2 投票 0

当需要安装旧版本的 pip 和 setuptools 时,如何定义 Python 包的要求?

我在 GitHub 存储库中有一个旧的 Open AIgym 环境,它需要gym==0.21.0 和 pyglet==1.5.27。基于这个答案,我发现我仍然可以安装和运行这些版本,前提是我使用旧版本

回答 1 投票 0

如何在Open AI健身房游戏中映射自定义按键?

我试图让用户使用自定义键来玩 CarRacing-v0 环境,我想我可以使用 utils.play 来实现这一点,如下所示: 进口健身房 从gym.utils.play导入* 玩(健身房...

回答 2 投票 0

体育馆。连续空间中的动作

我被介绍给Gymnasium(健身房)和RL,有一点我不明白,关于健身房如何管理动作。 我读到健身房环境中的动作是整数,意味着......

回答 1 投票 0

在 Google Colaboratory 上运行gym-gazebo

我正在尝试在 Google Colaboratory 上运行gym-gazebo。 在Colab上运行gazebo服务器(没有gui的gazebo)有问题。 显示警告:无法创建 X 窗口。渲染将是

回答 1 投票 0

面对强化学习的问题

进口健身房 从 stable_baselines3 导入 A2C env =gym.make('LunarLander-v2', render_mode="人类") env.reset() 模型 = A2C("MlpPolicy", env, verbose=1) 模型.学习(total_tim...

回答 1 投票 0

在 torchrl 推出期间如何访问有关我的体育馆环境的更多信息?

我目前正在我的自定义体育馆环境中训练 PPO 算法,目的是进行追逐躲避游戏。然而,在培训过程中,我想定期评估计划...

回答 1 投票 0

ValueError:在 Python OpenAI Gym 中设置带有序列的数组元素

我正在致力于使用 OpenAI Gym 的 MountainCar-v0 环境实现 Q 学习算法。但是,我遇到了以下错误: 离散状态 = (状态 - env.observation_space.low) /

回答 1 投票 0

如何录制和保存健身房环境视频

我已经训练了一个 DQN 代理,我想使用gym.wrappers.RecordVideo 录制并保存单集的视频。到目前为止,这是我的代码: 从gym.wrappers导入RecordVideo env =gym.make(“

回答 2 投票 0

如何降级Mujoco版本?

我使用 pip installgynasium[mujoco] 安装了 mujoco,如何将其降级到 mujoco==2.3.0?我尝试卸载它然后 pip installgymnasium[mujoco]==2.3.0 但似乎有一些错误

回答 1 投票 0

运行时错误:输入类型(无符号字符)和偏差类型(浮点型)应该相同

我正在使用 Pytorch、CUDA 和 Pycharm 为 Gymnasium 的俄罗斯方块环境编写 DQN 代理。当我的代理尝试决定采取行动时,错误就会出现。有问题 行动_...

回答 1 投票 0

ValueError:检查输入时出错:预期 flatten_input 具有形状 (1, 4),但得到的数组具有形状 (1, 2)

我对强化学习还很陌生,我真的不明白为什么会出现这个错误。 随机导入 将 numpy 导入为 np 将 numpy 导入为 np 从tensorflow.keras.models导入顺序 来自tensorflow.keras。

回答 5 投票 0

gym_super_mario_bros (7.3.0) - ValueError: 没有足够的值来解压(预期 5 个,得到 4)

我正在运行Python3(3.8.10)并尝试使用gym_super_mario_bros(7.3.0)和nes_py库进行教程。我遵循各种教程代码并在多台计算机上进行了尝试,但得到了一个呃......

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.