TRPO-RL:我需要获得一个8自由度的机械手才能移动到指定点。我需要在凉亭环境中使用OpenAI Gym来实现TRPO RL代码吗?

问题描述 投票:-1回答:1

TRPO-RL:我需要一个8自由度机械手来移动指定点。我需要使用OpenAI Gym来实现TRPO RL代码。我已经有了凉亭环境。但是我不确定如何编写奖励函数的代码和关节空间运动的算法。请帮忙。

reinforcement-learning robotics openai-gym gazebo-simu
1个回答
0
投票

奖励

凉亭应该能够告诉您末端执行器链接的位置,通过该链接我们可以计算出每一步之后朝着指定点的进展(即,朝目标移动时为正,远离目标时为负,并且否则为0)。仅此一项就应鼓励最终执行者实现目标。

您可能需要先考虑基本的奖励才能确认系统是否能够学习,然后再考虑其他标准,例如平滑度(避免抽动),偏斜度(将肘部左右放置)等。这些显然很难指定,并且必须根据您的需要进行手工设计,可能基于环境中可用的联合状态和/或某些其他派生工具。

动作

这在很大程度上取决于您的堆栈。我将这部分添加为通过评论,例如,如果您使用ROS作为中间件,则可以轻松集成Move-It为您处理所有运动。

© www.soinside.com 2019 - 2024. All rights reserved.