h2o 相关问题

H2O是用于分布式,可扩展机器学习的内存平台。 H2O使用熟悉的界面,如R,Python,Scala,Java,JSON和Flow笔记本/ Web界面,并与Hadoop和Spark等大数据技术无缝协作。 H2O提供许多流行算法的实现,例如GBM,随机森林,深度神经网络,Word2Vec和Stacked Ensembles。它是由H2O.ai(以前称为0xdata)维护的开源项目。

h2o-pysparkling-2.4 和 Glue 作业:{"error":"TypeError: 'JavaPackage' object is not callable","errorType":"EXECUTION_FAILURE"}

我尝试使用 pysparkling.ml.H2OMOJOModel 来使用在 AWS Glue 作业中使用 h2o==3.32.0.2 训练的 MOJO 模型来预测 Spark 数据帧,但如何出现错误:TypeError: 'JavaPackage' object.. .

回答 1 投票 0

h2o的分布式随机森林如何处理多类问题?

h2o 中分布式随机森林的文档指出,对于多类问题,“使用一棵树分别估计每个类的概率”。我可以在

回答 1 投票 0

为什么 h2o.r2() 与手动计算的 R^2 不匹配?

我正在使用 h2o.r2(),但它给了我一个与我手动计算的值非常不同的值...它似乎并不总是有这种行为...例如对于简单的线性模型,它似乎有效。 无论如何...

r h2o
回答 2 投票 0

H2O 构建失败,在 h2o-algos 中出现错误“找不到符号”

我尝试构建H2O开源,无论是稳定版本还是克隆版本,通过./gradlew构建的构建过程都因“错误:找不到符号”而失败,详细错误信息如下...

h2o
回答 1 投票 0

在 Google Dataproc 上使用苏打水部署 H2O MOJO 时面临问题

我正在尝试将模型从 Hadoop 迁移到 GCP。 MOJO 模型不会被重新训练。我正在使用 Airflow Spark Submit 在 Dataproc 中运行模型。 源数据格式与 Hadoop 源匹配并且

回答 1 投票 0

H2oGPT - 无法导入名称“set_seed”

我被H2oGPT困住了,我不能让它运行。 我在 Windows PC 上运行 第 11 代英特尔(R) 酷睿(TM) i7-11800H @ 2.30GHz 2.30 GHz 32GB内存64位 GPU Nvidia GeForce RTX 3050 我都关注了...

回答 1 投票 0

h2o 和 coxph ERRR 现场:_train:训练数据必须至少有 2 个特征(包括响应)

我正在尝试用水建立考克斯比例风险模型。事实上,我已经成功地使用深度学习建立了一个关于胃癌数据集中生存的模型。当尝试用水来做时。

r h2o
回答 1 投票 0

h2o H2OGenericEstimator 训练功能不起作用

我想使用 H2O 模型启用增量训练。我使用 MOJO 格式保存现有数据集/观察结果的训练模型。收到新的观察结果后,我想加载 MOJO-...

回答 1 投票 0

为什么我在 h2o AutoML 中训练的混淆矩阵只显示 10k 个总案例而不是 200k

我目前正在使用 h2o autoML 来训练一个关于二元分类问题的模型。我有火车(70% ~200k 行)、有效(10% ~30k 行)、测试(10% ~30k 行)和混合(10% ~30k 行)数据集...

回答 1 投票 0

从 H2O 苏打水模型获取阶段结果

我希望为我的模型输出之一创建置信区间,我需要在应用链接函数之前获取模型输出。从我读过的内容来看,我似乎很感兴趣......

回答 1 投票 0

如何将 H2O 苏打水模型保存到磁盘

我有一个 PySpark 代码来训练 H2o DRF 模型。我需要将这个模型保存到磁盘然后加载它。 从 pysparkling.ml 导入 H2ODRF drf = H2ODRF(featuresCols = 预测因子, 标签C...

回答 2 投票 0

一些预测变量的 SHAP 值都是正的

我在 H2O pacakage 中使用随机森林模型来解决二元预测问题,此处绘制的值用于 holdout 测试集。但是,下图显示了某些功能所有 SHAP ...

回答 0 投票 0

H2o Cluster Resources shared issue while on XGBoosts model process

我已经为我的模型使用了 XGBoost。我注意到 h2o 集群在此模型过程中不共享内存。 master A 服务器 RAM 利用率非常高,而 master B RAM 利用率非常低...

回答 0 投票 0

h2o 闪闪发光:读取 MOJO JSON 时出错:不支持对象:

我正在 Windows 上的本地 spark 安装上运行 Sparkling Water automl 示例(https://docs.h2o.ai/sparkling-water/3.3/latest-stable/doc/ml/sw_automl.html)(已添加顶部的代码设置

回答 0 投票 0

是否可以将 parquet 文件从 h2o on hadoop 写入本地存储?

我正在 Hadoop 集群上使用 h2o(最新版本 3.26.0.10)。我已经从 HDFS 读取了一个镶木地板文件,并对它进行了一些操作,建立了一个模型等。 我储存了一些重要的

回答 1 投票 0

从sqlite导入非常大的数据集到h2o中。

我有一个大约500G的数据库。它由16张表组成,每张表包含2或3列(第一列可以舍弃)和1,375,328,760行。我需要将所有的表连接成一个数据框架,在 ...

回答 1 投票 1

R 如何查看一个 ensemble_model (H2O) 的变量重要性图?

有没有人知道有看到变量重要性的情节,建立在H2O使用R的合奏模型?这段代码h2o.varimp_plot(ensemble_model)返回一个错误在max(tiv$coefficients):没有非遗漏......

回答 1 投票 1

H2O交叉验证选择的nfolds会改变数据的使用比例吗?

H2O手册中介绍了k折交叉验证的数据是如何拆分的。给出的例子是针对5折交叉验证的,请看这里:http:/docs.h2o.aih2olatest-stableh2o-docsdata-science...

回答 1 投票 0

获得提前停止的GBM使用的树木数量。

我在h2o中训练了一个GBM,使用早期停止,设置ntrees=10000。我想检索模型中实际存在的树的数量。但如果我调用model.params['ntrees'](其中model是最好的 ...

回答 1 投票 1

h2o中的所有算法都将支持在h2o自动化中,如奈夫贝叶斯,时间序列。

h2o中可用的所有算法都能在Automl中适用。例如,H2O automl能否在这些算法上运行,如时间序列、Cox Proportional Hazards(CoxPH)、naive bayes。

h2o
回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.