在 kubernetes 中部署时，收集方法在 spark 中花费的时间更长

问题描述投票：0回答：0

我一直在尝试在minikube上部署spark和jupyter note。我使用 helm charts 来部署两者

虽然能够建立到主人使用

spark = SparkSession.builder.master("spark://my-release-spark-master-0.my-release-spark-headless.default.svc.cluster.local:7077").getOrCreate()

运行以下代码片段时

nums= sc.parallelize([1,2,3,4])
squared = nums.map(lambda x: x*x).collect()
for num in squared:
    print('%i ' % (num))

运行collect()方法时执行耗时很长，永远不会完成

kubernetes

pyspark

jupyter-notebook

kubernetes-helm

minikube