我目前正在阅读 Sudharsan Ravichandiran 的《Python 强化学习实践》,在我遇到这个 AttributeError 的第一个示例中:
AttributeError 'TimeLimit' object has no attribute 'P'
由以下行提出:
for next_sr in env.P[state][action]:
我找不到任何有关env.P
的文档,但我在这里找到了用 python2 编写的类似示例:https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/ 我想
env.P是过时库的一部分(即使这本书是在 2018 年 6 月出版的,并且有罪的代码是 python3 中的),那么我该如何替换它呢?
env = env.unwrapped
for next_sr in env.env.P[state][action]:
注意开始时额外的“env”
对于一般用途,请尝试
>>> dir(class_name)
这将给出成员函数列表。
max_steps = args.max_timesteps or env.spec.max_episode_steps