reinforcement-learning 相关问题

强化学习是机器学习和计算机科学的一个领域,涉及如何在最大化特定环境中的数字奖励的状态中选择动作。

稳定基线:DQN 未正常执行?

我在使用 DQN 作为对角线和正弦波作为价格波动时遇到问题。当价格上涨时,会有奖励,在图表中显示为绿色。当价格下降...

回答 2 投票 0

我的 DeepQ 学习算法没有改进,我不明白为什么

我做了一个效果很好的Q学习算法,所以我会尝试做一个DeepQ学习算法来学习gym环境的CartPole环境。因此,基于我的 Q 学习算法,我尝试在 DeepQ-

回答 1 投票 0

PPO 仅适用于单个 epoch 和未剪裁的损失

我正在尝试实现 PPO 来击败 cartpole-v2,如果我将事情保持为 A2C(即,没有剪切损失和单个纪元),当我使用剪切损失和多个 epoch 时,我设法让它工作...

回答 1 投票 0

导入错误:无法从“stable_baselines3.common.envs”导入名称“DummyVecEnv”

将 numpy 导入为 np 将 pandas 导入为 pd 从 stable_baselines3 导入 DQN 从 stable_baselines3.common.envs 导入 DummyVecEnv 从健身房进口空间 导入 DummyVecEnv 时,我得到

回答 1 投票 0

强化学习体育馆ValueError

我第一次在体育馆测试强化学习。 我正在关注 YouTube 教程。 当我运行训练循环时,出现以下错误: ValueError:设置一个...

回答 1 投票 0

如何使用 Flux.jl 中的梯度更新 PPO 中的 actor 网络参数?梯度不返回任何内容

前言,我是一个完全的 Julia 新手...我第一次尝试实现 PPO,并且在使用 gra 更新 actor(以及扩展批评家)网络参数时遇到问题...

回答 1 投票 0

整个剧集中的奖励值相同

我正在开发 DDPG 并创建了自己的自定义环境,同时我注意到一些奇怪的事情,即在每一集中我的代理收集相同数量的奖励和我每集的步数...

回答 1 投票 0

强化学习中状态的效用

在Artificial Intelligence A Modern Approach (第3版-Russell)一书中,我们有一个像这样的4*3世界: 通过一些我不明白的计算,我们为每个员工提供了这个实用程序......

回答 1 投票 0

SB3 - 属性错误:“DummyVecEnv”对象没有属性“get_action_meanings”

当我尝试将 SB3 vec_env 与 AtariWrapper 结合使用时,出现错误 - 将体育馆导入为健身房 从 stable_baselines3 导入 PPO 从 stable_baselines3.common.env_util 导入 make_vec_env 来自

回答 1 投票 0

安装 pybullet 时遇到问题

我尝试使用以下命令在 Jupyter 笔记本上的 Windows 11 64 位操作系统上的 Python 3.9.12 上安装 pybullet 3.2.6: !pip 安装 pybullet>=3.2.6 但这会导致一个很长的错误

回答 1 投票 0

我需要为我的双边市场交易环境更改mu sb3代理的政策吗

我正在尝试在我的比特币交易环境中培训代理。我尝试了 finrl 库,但它没有任何良好的加密环境。 所以我尝试编写一个用于交易的双向市场环境

回答 1 投票 0

属性错误:模块“_Box2D”没有属性“RAND_LIMIT_swigconstant”

我正在尝试运行一个强化月球着陆器 正在学习,但是运行的时候却出现错误。 另外我的电脑是osx系统。 这是月球着陆器的代码: 将 numpy 导入为 np 进口健身房

回答 5 投票 0

训练 Deep Q 网络时如何实施“游戏规则”

我正在尝试制作一个 Deep-Q 网络,它可以自学玩井字棋的修改版本(一种 m、n、k 游戏) 我想确保网络不会在已有标记的地方放置标记 我

回答 1 投票 0

无法在 Anaconda 上从 OpenAI Gymnasium 捕获视频

我正在尝试从 OpenAI Gymnasium 捕获并保存视频。 在 Google Collab 中,此代码有效: !pip 安装体育馆 !pip 安装 moviepy 将体育馆导入为健身房 env =gym.make("CartPole-v1...

回答 1 投票 0

为什么我在尝试安装gym[all]时遇到错误?

我正在尝试安装gym[all],但每次都会收到此错误消息: 收集 pygame==2.1.0 (来自gym[all]) 使用缓存的 pygame-2.1.0.tar.gz (5.8 MB) 准备元数据(setup.py)...

回答 1 投票 0

无法使用 OpenGL 找到渲染

我正在使用 Mac,并尝试从 open ai 的健身房渲染环境 进口健身房 env=gym.make('CartPole-v1') img = env.render() 导入错误:找不到框架/System/Library/Frameworks/

回答 1 投票 0

自定义体育馆环境中的学习代理与 stable_baseline3 改变这个环境

我定制了一个gymnasium环境并使用stable_baseline3对其进行训练。但学习过程改变了我的环境。 >>>打印(env.step(2)) (510,-0.1,假,假,{}) >>>模型.学习(

回答 1 投票 0

无法在 stablebasekines3 中加载自定义模型

我尝试在 stablebaselines3 中加载预训练模型,但出现此错误。 C:\Users\prath\miniconda3 nvs lunitybutler\lib\site-packages\stable_baselines

回答 0 投票 0

Haskell GriWorld 无限循环

我正在尝试通过强化学习在 Haskell 中编写 GridWorld 模拟。我被困住了,因为我一直陷入第 109 行的无限循环。我已经盯着这个问题一周了,一个......

回答 1 投票 0

Keras-rl2 错误与 Tensorflow 的兼容性

我目前在使用 keras-rl2 和 tensorflow 时遇到问题,我不知道为什么,我只是在互联网上搜索 keras-rl2、tensorflow 和 keras 文档,但没有找到

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.