我是H2o ai的新手,我尝试过使用python api的一些东西。它对我来说很好看。我知道火花,我对苏打水非常感兴趣。所以我的问题是 - 在pySparkling中,我可以使用相同的python API应用于H2o ai ptatfom吗?
是..
根据pySparkling文档,我发现:
PySparkling是Python与Sparkling Water的集成。它允许用户从Python API启动Spark集群上的H2O服务。
在PySparkling驱动程序中,Spark Context使用Py4J启动驱动程序JVM和Java Spark Context,用于创建H2O Context(hc)。这反过来又启动了Spark生态系统中的H2O云(集群)。一旦H2O集群启动,H2O Python包就会用来与它交互并运行H2O算法。所有纯H2O调用都通过H2O的REST API接口执行。用户可以使用PySparkling轻松地将常规PySpark工作流程与H2O算法集成。