Google AutoML导入文本项非常慢

问题描述 投票:0回答:2

我正在将文本项目导入Google的AutoML。每行包含大约5000个字符,我正在添加70K这些行。这是一个多标签数据集。没有进度条或指示此过程需要多长时间。它已经运行了几个小时。有没有办法计算剩余时间或总估计时间。我想添加其他数据集,但我担心在培训开始之前这将是一个非常漫长的过程。任何形成甚至半疯狂猜测的公式都会很棒。 -谢谢!

google-cloud-platform automl google-cloud-automl-nl
2个回答
0
投票

我认为今天不可能,但我提交了一个功能请求[1],您可以关注更新。我要求培训和导入数据,就培训而言,它也很有用。


0
投票

我尝试用50K记录(约300字节/记录)进行训练,负载超过20分钟后我将其杀死。我用1K重试,跑了20分钟,然后给我发了一条错误消息,说我每次输入都有多个标签(是的,那么什么?培训数据会有一些),我有100个标签。我简化了分类桶并重新运行。又过了20分钟就取得了成功。然后我跑了“训练”,花了3个小时给我收了11美元。假设线性行为,那么50K recs的价格为550美元。对于第一次传球,预测结果并不差,但我觉得它在这个问题上投掷了一个超大神经网络。如果他们说NN是什么及其尺寸会有所帮助。他们说“beta”:)

© www.soinside.com 2019 - 2024. All rights reserved.