强化学习的时间步长>>

问题描述 投票:0回答:1

对于我的第一个强化学习项目,我正在尝试训练特工玩实时游戏。这意味着环境会不断变化并进行更改,因此代理需要精确地确定其时间安排。为了确定正确的顺序,我认为代理必须以一定的频率工作。我的意思是,如果代理具有10Hz频率,则必须每隔0.1秒接收一次输入并做出决定。但是,我找不到有关此问题/问题的任何资料,但这可能是由于在搜索中未使用正确的术语。这是解决此问题的有效方法吗?如果可以,我该怎么用?我正在Windows中使用python3(游戏仅在Windows中运行),是否可以使用任何库?我猜想time.sleep()不是可行的出路,因为它不是很精确(使用高频时),而且它只是冻结代理。

对于我的第一个强化学习项目,我正在尝试训练特工玩实时游戏。这意味着环境会不断变化并进行更改,因此代理必须是...

python python-3.x time reinforcement-learning
1个回答
0
投票

此问题尚无明确答案,因为它受多种因素影响,例如模型的推理时间,环境所接受的最大控制率以及解决环境所需的控制率。

© www.soinside.com 2019 - 2024. All rights reserved.