作为 OpenAI gymnasium 的初学者,我的目标是从头开始构建 SAC,并用它来训练代理解决 Bipedalwalker 问题。为了对 SAC 有一个平衡的输入,我想将来自健身房的动作和观察标准化为 0 到 1 之间。我找到了 RescaleAction 动作方法,而我不知道在哪里使用 NormalizeObservation 方法...你认为我可以在启动环境时使用它然后这将适用于所有以下观察:
base_env = gym.make("BipedalWalker-v3", render_mode = 'rgb_array')
env = RescaleAction(base_env, min_action=0, max_action=1)
env = NormalizeObservation(env)
这样对吗? 我对文档中的note感到困惑。