调用GET / 3 / Jobs h2o模型训练时出错,大数据出错

问题描述 投票:0回答:1

我正在尝试在大数据(200万个交易数据)上构建模型,并且低于错误。在进度条中的模型构建方面没有任何进展,并且一段时间后由于以下错误而停止了作业。我们在单个节点上运行此模型并且h2o没有分发。请建议这与内存问题有关。例如,如果我们有20 GB的训练数据,那么应该给h2o分配多少内存大小?是否所有完整的训练框架都存储在堆内存中?

Error fetching job '$03010a010d6832d4ffffffff$_9bf0e32df1dba1c2d24eb8a513f47a4'
Error calling GET /3/Jobs/%2403010a010d6832d4ffffffff%24_9bf0e32df1dba1c2d24eb8a513f47a4
HTTP connection failure: status=error, code=503, error=Service Temporarily Unavailable

谢谢Deepti

machine-learning h2o predictive h2o4gpu
1个回答
0
投票

H2O群集可能由于内存不足而崩溃,并且您的客户端失去与之的通信。您需要查看H2O日志以确定错误/原因。

© www.soinside.com 2019 - 2024. All rights reserved.