我正在尝试学习Tune的基础知识。在下面的脚本中,我希望每个工作程序都运行100次迭代,然后结束,但是,这些工作程序在状态3(TypeError?)达到100次迭代之前结束。我没有看到任何错误消息,因此我可能对实际发生的事情感到困惑。在10个样本中,只有2个达到100次迭代。其余样本在5到16次迭代之间。
"""Testing Tune with CartPole."""
import ray
from ray import tune
from ray.tune.schedulers import AsyncHyperBandScheduler
from ray.tune.suggest.bayesopt import BayesOptSearch
if __name__ == "__main__":
tune_metric = "info/learner/default_policy/critic_loss"
space = {"gamma": (0.01, 1)}
algo = BayesOptSearch(
space,
metric=tune_metric,
mode="min",
utility_kwargs={
"kind": "ucb",
"kappa": 2.5,
"xi": 0.0
})
scheduler = AsyncHyperBandScheduler(metric=tune_metric, mode="min")
ray.init()
analysis = tune.run(
"SAC",
stop={"training_iteration": 100},
search_alg=algo,
scheduler=scheduler,
num_samples=10,
config={
"env": "CartPole-v0",
},
)
print("Best config: ", analysis.get_best_config(metric=tune_metric,
mode="min"))
[当我尝试运行以下示例时,会发生相同的事情(mnist pytorch trainable]