如何在Eclipse环境中设置spark的堆大小？

Question

我试图在Eclipse中使用spark运行简单的以下代码：

import org.apache.spark.sql.SQLContext
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
object jsonreader {  
  def main(args: Array[String]): Unit = {
    println("Hello, world!")
    val conf = new SparkConf()
      .setAppName("TestJsonReader")
      .setMaster("local")
      .set("spark.driver.memory", "3g") 
    val sc = new SparkContext(conf)

    val sqlContext = new SQLContext(sc)
    val df = sqlContext.read.format("json").load("text.json")

    df.printSchema()
    df.show   
  }
}

但是，我收到以下错误：

16/08/18 18:05:28 ERROR SparkContext: Error initializing SparkContext.
java.lang.IllegalArgumentException: System memory 259522560 must be at least 471859200. Please increase heap size using the --driver-memory option or spark.driver.memory in Spark configuration.

我按照这样的不同教程：How to set Apache Spark Executor memory。大部分时间我使用--driver-memory选项（Eclipse不可能）或修改spark配置但没有相应的文件。

有没有人知道如何在Eclipse环境中解决这个问题？

Answer 1

在Eclipse中，转到Run> Run Configurations ...> Arguments> VM arguments并设置max heapsize，如-Xmx512m。

Answer 2

我也有这个问题，这就是我解决它的方法。认为它可能会有所帮助。

val conf: SparkConf = new SparkConf().setMaster("local[4]").setAppName("TestJsonReader").set("spark.driver.host", "localhost")
conf.set("spark.testing.memory", "2147480000")

Answer 3

一旦将脚本修改为conf.set（“spark.testing.memory”，“2147480000”），我就可以正常工作

完整代码如下：

import scala.math.random
import org.apache.spark._

object SparkPi {
  def main(args: Array[String]) {
    val conf: SparkConf = new SparkConf().setMaster("local").setAppName("Spark Pi").set("spark.driver.host", "localhost")

     conf.set("spark.testing.memory", "2147480000")         // if you face any memory issues


    val spark = new SparkContext(conf)
    val slices = if (args.length > 0) args(0).toInt else 2
    val n = math.min(100000L * slices, Int.MaxValue).toInt // avoid overflow

    val count = spark.parallelize(1 until n, slices).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x * x + y * y < 1) 1 else 0
    }.reduce(_ + _)

    println("Pi is roughly " + 4.0 * count / n)
    spark.stop()
  }
}

第2步

Run it as “Scala Application”

步骤3创建JAR文件和执行：

bin/spark-submit --class SparkPi --master local SparkPi.jar

Answer 4

您可以通过编辑“$ {SPARK_HOME} / conf /”中的“spark-defaults.conf”文件来设置“spark.driver.memory”选项。默认情况下，没有名为“spark-defaults.conf”的文件。目录为“$ {SPARK_HOME} / conf /”，但是有一个文件“spark-defaults.conf.template”，您可以使用以下命令创建“spark-defaults.conf”文件：

cp spark-defaults.conf.template spark-defaults.conf

然后，编辑它：

# Example:
# spark.master                     spark://master:7077
# spark.eventLog.enabled           true
# spark.eventLog.dir               hdfs://namenode:8021/directory
# spark.serializer                 org.apache.spark.serializer.KryoSerializer
# spark.driver.memory              5g
# spark.executor.extraJavaOptions  -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"


spark.driver.memory              3g

Answer 5

在我的情况下，mvn停止打包项目，同样的例外（java.lang.IllegalArgumentException: System memory 259522560 must be at least 471859200.）。

我开始通过changing the settings for the VM heap size调试此问题：export MAVEN_OPTS="-Xms1024m -Xmx4096m -XX:PermSize=1024m"。那没起效..

然后我尝试向spark config添加等于spark.driver.memory [1g]的SparkConfig.set("spark.driver.memory","1g")选项。

最后，事实证明我的java安装已经被搞砸了。我重新安装了JDK（更新版本）并且不得不重新设置JAVA_HOME路径，然后一切都在终端上工作。

如果升级，要使用qazxsw poi / qazxsw poi / qazxsw poi，有人需要在每个中配置Netbeans设置以指向Java Development Kit的新安装。

Answer 6

如果你在本地运行，你还需要增加spark.testing.memory

spark.driver.memory，571859200 spark.testing.memory，2147480000

如何在Eclipse环境中设置spark的堆大小？

问题描述投票：7回答：5

5个回答

完整代码如下：

最新问题

如何在Eclipse环境中设置spark的堆大小？

问题描述 投票：7回答：5

5个回答

完整代码如下：

最新问题

问题描述投票：7回答：5