健身房出租车-v2为折旧。我的Q学习工具仍可与Taxi-v3配合使用,但是对于某些重新使用环境,env.render()在每个步骤都显示错误的滑行位置。
无论如何,除了增加了墙外,Taxi-v2 v Taxi-v3有什么区别?
说明和地图中有一些小的更正,您可以查看pull request in github以获取详细信息。