有没有办法使用API 提交spark作业

问题描述 投票:0回答:2

我可以使用控制台在linux服务器上提交spark作业。但是有没有API或某些框架可以在linux服务器上提交spark作业?

apache-spark pyspark spark-streaming distributed-computing spark-submit
2个回答
0
投票

您可以使用端口7077在spark集群中提交spark作业,而不是使用spark-submit。

val spark = SparkSession
.builder()
.master(spark://master-machine:7077)

0
投票

你可以看看Livy服务器。它是在Hortonworks的GA模式和Apache Hadoop的Cloudera发行版中。我们取得了很大的成功。它的文档很好,可以开始使用。当通过Livy提交时,Spark作业会立即启动,因为它内部运行了多个SparkContexts。

© www.soinside.com 2019 - 2024. All rights reserved.