带有定制模型的矢量信封

问题描述 投票:0回答:1

我一直在阅读如何在SubProcVenv模块中使用向量化环境从herehere

但是,我可以找到的所有示例都使用稳定的基线(openai的模型),而且我似乎找不到使用自定义模型进行操作的方法。

可以做到吗?以及如何?

python tensorflow keras reinforcement-learning openai-gym
1个回答
0
投票

可以按照Colab笔记本中的说明进行操作。我不确定您要面对什么问题。我为自定义环境实现的方式是:

# Instantiate the env
env = customEnv()

# Wrap it
env = DummyVecEnv([lambda: env])

EPISODES = 5000
# Instantiate and learn using stable-baselines
model = PPO2('MlpPolicy', env).learn(EPISODES)

我确定您也可以对SubProcVenv执行相同的操作。如果要使用多重处理,请使用SubProcVenv only

© www.soinside.com 2019 - 2024. All rights reserved.