Spark程序报错排查:A master URL must be set in your configuration

喜欢ヅ旅行 2022-10-01 12:57 120阅读 0赞

今天在在本地测试spark程序,点击运行main方法,报了如下错误:(spark版本为2.1.1)

  1. org.apache.spark.SparkException: A master URL must be set in your configuration
  2. at org.apache.spark.SparkContext.<init>(SparkContext.scala:379)
  3. at org.apache.spark.SparkContext$.getOrCreate(SparkContext.scala:2320)
  4. at org.apache.spark.sql.SparkSession$Builder$$anonfun$6.apply(SparkSession.scala:868)
  5. at org.apache.spark.sql.SparkSession$Builder$$anonfun$6.apply(SparkSession.scala:860)
  6. at scala.Option.getOrElse(Option.scala:121)
  7. at org.apache.spark.sql.SparkSession$Builder.getOrCreate(SparkSession.scala:860)
  8. at com.gimc.dsp.spark.main.dsp.OrderMappingMain.main(OrderMappingMain.java:60)
  9. 19/06/12 11:32:33 INFO SparkContext: Successfully stopped SparkContext
  10. Exception in thread "main" org.apache.spark.SparkException: A master URL must be set in your configuration
  11. at org.apache.spark.SparkContext.<init>(SparkContext.scala:379)
  12. at org.apache.spark.SparkContext$.getOrCreate(SparkContext.scala:2320)
  13. at org.apache.spark.sql.SparkSession$Builder$$anonfun$6.apply(SparkSession.scala:868)
  14. at org.apache.spark.sql.SparkSession$Builder$$anonfun$6.apply(SparkSession.scala:860)
  15. at scala.Option.getOrElse(Option.scala:121)
  16. at org.apache.spark.sql.SparkSession$Builder.getOrCreate(SparkSession.scala:860)
  17. at com.gimc.dsp.spark.main.dsp.OrderMappingMain.main(OrderMappingMain.java:60)

这个报错的原因在于没有设置程序运行的master,需要进行相应的配置。

传给spark的master有如下几种:

  1. local 本地单线程
  2. local[K] 本地多线程(指定K个内核)
  3. local[*] 本地多线程(指定所有可用内核)
  4. spark://HOST:PORT 连接到指定的 Spark standalone cluster master,需要指定端口。
  5. mesos://HOST:PORT 连接到指定的 Mesos 集群,需要指定端口。
  6. yarn-client客户端模式 连接到 YARN 集群。需要配置 HADOOP_CONF_DIR
  7. yarn-cluster集群模式 连接到 YARN 集群。需要配置 HADOOP_CONF_DIR

本地配置spark master的方式有如下两种:

一.通过spark代码进行配置

可以通过以下代码进行配置:

  1. //java版本
  2. SparkConf conf = new SparkConf();
  3. conf.setMaster("local"); //本地单线程运行
  4. conf.setAppName("testJob");
  5. JavaSparkContext sc = new JavaSparkContext(conf);
  6. //scala版本
  7. val sparkConf = new SparkConf()
  8. sparkConf.setMaster("local") //本地单线程运行
  9. sparkConf.setAppName("testJob")
  10. val sc = new SparkContext(sparkConf)

二.通过设置JVM运行参数进行配置

在idea上点击edit configuration,在左侧选择需要配置参数的项目,然后在右侧VM options中输入“-Dspark.master=local”,指示本程序本地单线程运行,再次运行即可。

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxOTgwOA_size_16_color_FFFFFF_t_70

发表评论

表情:
评论列表 (有 0 条评论,120人围观)

还没有评论,来说两句吧...

相关阅读