在模拟 OpenAI 健身房环境的轨迹时,例如 Mujoco Walker2d,将当前观察和动作输入健身房步骤函数以产生下一个观察。然而,似乎没有办法只渲染给定的观察轨迹(这就是渲染所需的全部)!有谁知道如何做到这一点,或者甚至可能吗?
你可以使用
env.render
例子:
for i in range(len(states)): env.unwrapped.state = states[i] env.render()
states