使用线性系统实现冰冻湖

问题描述 投票:0回答:0

有没有人试过用线性系统解决冰冻湖?我不知道如何将 MDP 问题转换为线性系统。

python dynamic iteration reinforcement-learning policy
© www.soinside.com 2019 - 2024. All rights reserved.