Google AutoML培训错误/无法部署模型

问题描述 投票:0回答:1

我有一个带有727253标记图像的多标签数据集。最小的标签出现次数约为15,最大约为200000.模型训练开始~18小时前,现在失败,并显示以下消息:

Unable to deploy model

cancel_lro() got an unexpected keyword argument 'min_nodes'

Pipeline d884756f14314048b7a036f5b07f0fd2 timeout.

自动生成的电子邮件包含以下内容:

Last error message

Please reference 116298312436989152 when reporting errors.

这已经知道了吗?我也选择了免费计划(1小时)来训练。我需要增加它才能正常工作吗?有没有办法在训练期间看到一个状态来预测大的等待时间而没有结果? (我尝试了API,但没有百分比或其他类似的东西,仅适用于成品模型。)

提前致谢!

google-cloud-platform google-cloud-automl
1个回答
0
投票

这似乎是一个内部错误。主要问题似乎是管道超时。作为超时的一部分,它尝试进行某种清理,这次清理似乎有一个bug。

我的建议是重新尝试管道。

© www.soinside.com 2019 - 2024. All rights reserved.