Stable Baselines 3:默认参数

问题描述 投票:0回答:1

我正在使用来自 Stablebaselines3 的 PPO 和 A2C 算法与 openai-gym 运行一些模拟。 我知道我可以自定义所有这些,但我想知道哪些是默认参数。 特别是网络结构和学习率......

有人知道这些值或知道我在哪里可以找到它们吗?

提前致谢,塞缪尔

我还没有在稳定的基线文档中找到它..

deep-learning reinforcement-learning openai-gym stable-baselines
1个回答
0
投票

对于 A2C,您要查找的值位于此处的文档中: https://stable-baselines3.readthedocs.io/en/master/modules/a2c.html#stable_baselines3.a2c.A2C

class stable_baselines3.a2c.A2C(policy, env, learning_rate=0.0007, n_steps=5, gamma=0.99, gae_lambda=1.0, ent_coef=0.0, vf_coef=0.5, max_grad_norm=0.5, rms_prop_eps=1e-05, use_rms_prop=True, use_sde=False, sde_sample_freq=-1, normalize_advantage=False, tensorboard_log=None, policy_kwargs=None, verbose=0, seed=None, device='auto', _init_setup_model=True)

对于 PPO,值位于此处: https://stable-baselines3.readthedocs.io/en/master/modules/ppo.html#stable_baselines3.ppo.PPO

class stable_baselines3.ppo.PPO(policy, env, learning_rate=0.0003, n_steps=2048, batch_size=64, n_epochs=10, gamma=0.99, gae_lambda=0.95, clip_range=0.2, clip_range_vf=None, normalize_advantage=True, ent_coef=0.0, vf_coef=0.5, max_grad_norm=0.5, use_sde=False, sde_sample_freq=-1, target_kl=None, tensorboard_log=None, policy_kwargs=None, verbose=0, seed=None, device='auto', _init_setup_model=True)

文档包含每个参数的简要说明,但如果有不清楚的地方,请随时询问。

如果这些不是您要查找的参数,请告诉我。

© www.soinside.com 2019 - 2024. All rights reserved.