OpenAI-Gym中的自定义环境

问题描述 投票:-1回答:1

我想在Python中尝试强化学习。但我想用自己的州和奖励创建一个自定义环境。

可能我想在这里使用时间序列数据(不过像股票一样)。我希望我的系统在给定环境的情况下根据时间学习行为。

所以我首先要创建一个自定义环境,有人可以帮助我吗?

development-environment reinforcement-learning openai-gym
1个回答
1
投票

OPEN-AI健身房环境注册过程可以找到here

请通过this示例自定义环境和this stackoverflow问题获取更多信息。

可能我想在这里使用时间序列数据(不过像股票一样)。我希望我的系统在给定环境的情况下根据时间学习行为。

如果你想让代理人学习w.r.t.时间然后包括时间步作为您所在州的变量。然后,您的代理人将能够区分两个与时间步长不同的不同状态。

© www.soinside.com 2019 - 2024. All rights reserved.