如何在气泡水中指定H2O版本?

问题描述 投票:0回答:1

在 Databricks 笔记本中,我尝试加载针对 H2O 版本 3.30.1.3 训练的 H2O 模型。

我已经安装了与用于模型训练(3.0)的 Spark 版本相对应的 Sparkling Water 版本,

h2o-pysparkling-3.0
,这是我从 PyPI 中提取的。

Sparkling Water 服务器使用的是最新版本的 H2O,而不是我需要的版本。也许有一种方法可以在我启动 Sparkling Water 上下文时指定 H2O 版本?像这样的东西:

import h2o
from pysparkling import H2OContext
from pysparkling.ml import H2OBinaryModel

hc = H2OContext.getOrCreate(h2o_version='3.30.1.3')
model = H2OBinaryModel.read('s3://bucket/model_file')

我在没有参数

H2OContext.getOrCreate()
的情况下运行上面的代码,并收到此错误:

IllegalArgumentException: 
 The binary model has been trained in H2O of version
 3.30.1.3 but you are currently running H2O version of 3.34.0.6.
 Please make sure that running Sparkling Water/H2O-3 cluster and the loaded binary
 model correspond to the same H2O-3 version.

苏打水的 Python API 在哪里?如果我能发现,我也许能够确定上下文初始化程序是否有 H2O 版本参数,但令人惊讶的是,到目前为止,我不可能通过 Google 找到并在文档中查找。

或者这是通过安装特定于 H2O 版本的 Sparkling Water 版本来解决的问题吗?或者也许某个地方还有另一个相关的配置设置?

h2o sparkling-water
1个回答
1
投票

您尝试过笔记本范围的库概念吗?笔记本范围的库允许您创建、修改、保存、重用和共享特定于笔记本的自定义 Python 环境。当您安装笔记本范围的库时,只有当前笔记本和与该笔记本关联的任何作业才能访问该库。连接到同一群集的其他笔记本不受影响。您可以参考:链接

限制:笔记本范围的库不会跨会话持续存在。您必须在每个会话开始时或每当笔记本与集群分离时重新安装笔记本范围的库。

© www.soinside.com 2019 - 2024. All rights reserved.