H2O是用于分布式,可扩展机器学习的内存平台。 H2O使用熟悉的界面,如R,Python,Scala,Java,JSON和Flow笔记本/ Web界面,并与Hadoop和Spark等大数据技术无缝协作。 H2O提供许多流行算法的实现,例如GBM,随机森林,深度神经网络,Word2Vec和Stacked Ensembles。它是由H2O.ai(以前称为0xdata)维护的开源项目。
我尝试使用AutoML进行100小时的二进制分类任务。它似乎只是构建了大量的GBM模型而没有进入其他类型。 (到目前为止已建成40)是否有......
我是H2O的新手,我通过R访问它。我正在尝试构建随机森林,XGBoost,GBM模型来解决多类问题。 H2O提供的模型性能见解很棒,但......
我对一个特定主题有一个普遍的问题。我使用Word2Vec生成的向量作为功能提供到我的分布式随机森林模型中,用于对某些记录进行分类。我有数百万......
如何在基于Java / JVM的应用程序中拟合和评分机器学习模型
能否指导我如何创建和执行机器学习模型/统计模型(回归,决策树,K意味着聚类,朴素贝叶斯,记分卡/线性/逻辑回归......
为什么需要首先下载mojo或pojo并在之后阅读?为什么我不能将它用作Java中的中间变量?我搜索了这些例子,发现所有例子都是这样的:......
YARN上的RSparkling Spark错误(java.lang.ClassNotFoundException:water.fvec.frame)
我正在尝试设置我的R环境以在YARN群集上运行h2o算法。 (由于安全原因无法访问互联网 - 在R服务器上运行)以下是我当前的环境设置:...
我用一组不同的hiperparameters运行了h2o.grid。下面你可以看到与它相关的代码:库(插入符号)库(ROCR)库(h2o)h2o.init()#...
如何阻止h2o将大量的.ERR,.OUT和其他日志文件保存到本地驱动器
我目前正在运行一个脚本,其中为蒙特卡罗交叉验证的几次迭代生成了几个h2o glm和deeplearning模型。完成运行后(需要...
我正在尝试使用Python中的h2o导入文件。 h2o.init()是成功的,但是当我执行以下操作时:df = h2o.import_file(path =“Combined Database - Final.csv”)我得到了一些错误......
在H2O中尝试通过java运行AutoML时,总是得到一个java.lang.ArrayIndexOutOfBoundsException
我正在使用H2O 3.20.0.5来训练一些模型。我想在我的java代码中使用AutoML构建模型。现在我可以导入和解析csv文件。但是当我尝试调用AutoML.startAutoML()。get()时,我总是得到一个......
我在R中使用sparklyr和H2O来实现开发一些ML模型。在初始数据读取时出错。我使用spark_read_csv提取数据,使用sdf_partition设置分区然后定义...
我正在寻找一种类似于pandas中的'apply'函数的方法。我尝试了my_H2Oframe.apply(lambda x:my_function(x),axis = 1)但是这不起作用。 ValueError:未实现:op <...
我是R和ML的新手,但有一个我想回答的焦点问题。我正在使用我自己的数据,但是按照Matt Dancho的例子来预测消耗:http://www.business-science.io / ...
如何解释随机森林分类的 H2O .predict方法的输出?
当我在训练模型上使用预测方法时,我得到的输出是1行和206列。它似乎有206个值,范围从0到1。这种模型的输出有意义......
我一直在尝试为数据集构建一个模型,其中包含R中的7000万条记录。我尝试了每个可能的选项来构建像聚类一样的模型,使用ff库,h2o(这就是扔我...
使用H2O.ai POJO / MOJO / API和流行的BI工具
安装和使用H2O.ai的Flow UI非常棒 - 但是有没有人尝试在Qlik / PowerBI等流行的BI工具中使用构建的模型?我已经阅读了一些POJO / MOJO输出,做这些......
数学上,offset_column参数在训练期间和H2O中随机森林算法的预测期间如何工作?来自文档:注意:偏移量是每行“偏差值”......
H2O如何确定基础学习者的权重?对于exp。在这个例子中,所有基础学习者是否均等加权?我是否有机会在...中使用正则化参数(例如脊)
使用Python Notebook在Databricks中创建Sparkling Water Cloud
我正在尝试使用Databricks在Spark中启动Sparkling Water云。我附上了H2O库(3.16.0.2),PySparkling(pysparkling 0.4.6)和Sparkling Water jar(波光粼粼的水......)。
H2O Python演示不适用于jupyter笔记本并显示异常,因为这些演示正在设置按键事件。 (按任意键)demo_function(交互式,回声,测试)文件“/ home / ...