我们正在尝试学习围绕电路自动驾驶卡丁车。在我们的研究中,我们看到强化学习用于虚拟环境。现在我们正在尝试使用变形金刚模型进行驾驶,并在必要时纠正卡丁车。
我们想尝试这样做,以更好地教导模型在做出错误决定时在某些回合该怎么做。