reinforcement-learning 相关问题

强化学习是机器学习和计算机科学的一个领域，涉及如何在最大化特定环境中的数字奖励的状态中选择动作。

稳定基线：DQN 未正常执行？

我在使用 DQN 作为对角线和正弦波作为价格波动时遇到问题。当价格上涨时，会有奖励，在图表中显示为绿色。当价格下降...

reinforcement-learning dqn stable-baselines

回答 2 投票 0

我的 DeepQ 学习算法没有改进，我不明白为什么

我做了一个效果很好的Q学习算法，所以我会尝试做一个DeepQ学习算法来学习gym环境的CartPole环境。因此，基于我的 Q 学习算法，我尝试在 DeepQ-

python pytorch reinforcement-learning dqn

回答 1 投票 0

PPO 仅适用于单个 epoch 和未剪裁的损失

我正在尝试实现 PPO 来击败 cartpole-v2，如果我将事情保持为 A2C（即，没有剪切损失和单个纪元），当我使用剪切损失和多个 epoch 时，我设法让它工作...

machine-learning deep-learning pytorch reinforcement-learning

回答 1 投票 0

导入错误：无法从“stable_baselines3.common.envs”导入名称“DummyVecEnv”

将 numpy 导入为 np 将 pandas 导入为 pd 从 stable_baselines3 导入 DQN 从 stable_baselines3.common.envs 导入 DummyVecEnv 从健身房进口空间导入 DummyVecEnv 时，我得到

python python-3.x reinforcement-learning

回答 1 投票 0

强化学习体育馆ValueError

我第一次在体育馆测试强化学习。我正在关注 YouTube 教程。当我运行训练循环时，出现以下错误： ValueError：设置一个...

python pytorch reinforcement-learning gymnasium

回答 1 投票 0

如何使用 Flux.jl 中的梯度更新 PPO 中的 actor 网络参数？梯度不返回任何内容

前言，我是一个完全的 Julia 新手...我第一次尝试实现 PPO，并且在使用 gra 更新 actor（以及扩展批评家）网络参数时遇到问题...

julia reinforcement-learning gradient-descent flux.jl

回答 1 投票 0

整个剧集中的奖励值相同

我正在开发 DDPG 并创建了自己的自定义环境，同时我注意到一些奇怪的事情，即在每一集中我的代理收集相同数量的奖励和我每集的步数...

reinforcement-learning ddpg

回答 1 投票 0

强化学习中状态的效用

在Artificial Intelligence A Modern Approach (第3版-Russell)一书中，我们有一个像这样的4*3世界：通过一些我不明白的计算，我们为每个员工提供了这个实用程序......

utilities reinforcement-learning

回答 1 投票 0

SB3 - 属性错误：“DummyVecEnv”对象没有属性“get_action_meanings”

当我尝试将 SB3 vec_env 与 AtariWrapper 结合使用时，出现错误 - 将体育馆导入为健身房从 stable_baselines3 导入 PPO 从 stable_baselines3.common.env_util 导入 make_vec_env 来自

deep-learning reinforcement-learning stable-baselines

回答 1 投票 0

安装 pybullet 时遇到问题

我尝试使用以下命令在 Jupyter 笔记本上的 Windows 11 64 位操作系统上的 Python 3.9.12 上安装 pybullet 3.2.6： !pip 安装 pybullet>=3.2.6 但这会导致一个很长的错误

simulation reinforcement-learning robotics openai-gym bulletphysics

回答 1 投票 0

我需要为我的双边市场交易环境更改mu sb3代理的政策吗

我正在尝试在我的比特币交易环境中培训代理。我尝试了 finrl 库，但它没有任何良好的加密环境。所以我尝试编写一个用于交易的双向市场环境

python reinforcement-learning bitcoin trading finrl

回答 1 投票 0

属性错误：模块“_Box2D”没有属性“RAND_LIMIT_swigconstant”

我正在尝试运行一个强化月球着陆器正在学习，但是运行的时候却出现错误。另外我的电脑是osx系统。这是月球着陆器的代码：将 numpy 导入为 np 进口健身房

python machine-learning box2d reinforcement-learning

回答 5 投票 0

训练 Deep Q 网络时如何实施“游戏规则”

我正在尝试制作一个 Deep-Q 网络，它可以自学玩井字棋的修改版本（一种 m、n、k 游戏）我想确保网络不会在已有标记的地方放置标记我

reinforcement-learning q-learning

回答 1 投票 0

无法在 Anaconda 上从 OpenAI Gymnasium 捕获视频

我正在尝试从 OpenAI Gymnasium 捕获并保存视频。在 Google Collab 中，此代码有效： !pip 安装体育馆 !pip 安装 moviepy 将体育馆导入为健身房 env =gym.make("CartPole-v1...

video anaconda google-colaboratory reinforcement-learning openai-gym

回答 1 投票 0

为什么我在尝试安装gym[all]时遇到错误？

我正在尝试安装gym[all]，但每次都会收到此错误消息：收集 pygame==2.1.0 (来自gym[all]) 使用缓存的 pygame-2.1.0.tar.gz (5.8 MB) 准备元数据（setup.py）...

python pytorch google-colaboratory reinforcement-learning openai-gym

回答 1 投票 0

无法使用 OpenGL 找到渲染

我正在使用 Mac，并尝试从 open ai 的健身房渲染环境进口健身房 env=gym.make('CartPole-v1') img = env.render() 导入错误：找不到框架/System/Library/Frameworks/

python opengl reinforcement-learning openai-gym

回答 1 投票 0

自定义体育馆环境中的学习代理与 stable_baseline3 改变这个环境

我定制了一个gymnasium环境并使用stable_baseline3对其进行训练。但学习过程改变了我的环境。 >>>打印(env.step(2)) （510，-0.1，假，假，{}） >>>模型.学习(

reinforcement-learning

回答 1 投票 0

无法在 stablebasekines3 中加载自定义模型

我尝试在 stablebaselines3 中加载预训练模型，但出现此错误。 C:\Users\prath\miniconda3 nvs lunitybutler\lib\site-packages\stable_baselines

python pytorch reinforcement-learning stable-baselines

回答 0 投票 0

Haskell GriWorld 无限循环

我正在尝试通过强化学习在 Haskell 中编写 GridWorld 模拟。我被困住了，因为我一直陷入第 109 行的无限循环。我已经盯着这个问题一周了，一个......

haskell infinite-loop reinforcement-learning q-learning

回答 1 投票 0

Keras-rl2 错误与 Tensorflow 的兼容性

我目前在使用 keras-rl2 和 tensorflow 时遇到问题，我不知道为什么，我只是在互联网上搜索 keras-rl2、tensorflow 和 keras 文档，但没有找到

python tensorflow machine-learning anaconda reinforcement-learning

回答 1 投票 0

reinforcement-learning 相关问题

最新问题