我正在尝试将模型从 Hadoop 迁移到 GCP。 MOJO 模型不会被重新训练。我正在使用 Airflow Spark Submit 在 Dataproc 中运行模型。 源数据格式与 Hadoop 源等一切匹配。运行模型时,我收到此错误:
Caused by: hex.genmodel.easy.exception.PredictUnknownCategoricalLevelException: Unknown categorical level (my_column,Y)
此列的值与我们在 Hadoop 上的值相同,并且一切正常。 模型是在H20版本
3.30.0.4
创建的,MOJO版本是1.4
。
运行 dataproc 集群时,我正在使用
"PIP_PACKAGES": "h2o_pysparkling_3.1"
不确定问题是什么?请帮忙。
您可以尝试启用
convertUnknownCategoricalLevelsToNa
吗?