spark git commit: [SPARK-11555] spark on yarn spark-class --num-workers doesn't work

vanzin Fri, 06 Nov 2015 15:25:09 -0800

Repository: spark
Updated Branches:
  refs/heads/master c447c9d54 -> f6680cdc5



[SPARK-11555] spark on yarn spark-class --num-workers doesn't work

I tested the various options with both spark-submit and spark-class of 
specifying number of executors in both client and cluster mode where it applied.

--num-workers, --num-executors, spark.executor.instances, 
SPARK_EXECUTOR_INSTANCES, default nothing supplied

Author: Thomas Graves <tgra...@staydecay.corp.gq1.yahoo.com>

Closes #9523 from tgravescs/SPARK-11555.


Project: http://git-wip-us.apache.org/repos/asf/spark/repo
Commit: http://git-wip-us.apache.org/repos/asf/spark/commit/f6680cdc
Tree: http://git-wip-us.apache.org/repos/asf/spark/tree/f6680cdc
Diff: http://git-wip-us.apache.org/repos/asf/spark/diff/f6680cdc

Branch: refs/heads/master
Commit: f6680cdc5d2912dea9768ef5c3e2cc101b06daf8
Parents: c447c9d
Author: Thomas Graves <tgra...@staydecay.corp.gq1.yahoo.com>
Authored: Fri Nov 6 15:24:33 2015 -0800
Committer: Marcelo Vanzin <van...@cloudera.com>
Committed: Fri Nov 6 15:24:33 2015 -0800

----------------------------------------------------------------------
 .../scala/org/apache/spark/deploy/yarn/ClientArguments.scala  | 2 +-
 .../org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala    | 7 +++++--
 2 files changed, 6 insertions(+), 3 deletions(-)
----------------------------------------------------------------------


http://git-wip-us.apache.org/repos/asf/spark/blob/f6680cdc/yarn/src/main/scala/org/apache/spark/deploy/yarn/ClientArguments.scala
----------------------------------------------------------------------
diff --git 
a/yarn/src/main/scala/org/apache/spark/deploy/yarn/ClientArguments.scala 
b/yarn/src/main/scala/org/apache/spark/deploy/yarn/ClientArguments.scala
index 1165061..a9f4374 100644
--- a/yarn/src/main/scala/org/apache/spark/deploy/yarn/ClientArguments.scala
+++ b/yarn/src/main/scala/org/apache/spark/deploy/yarn/ClientArguments.scala
@@ -81,7 +81,7 @@ private[spark] class ClientArguments(args: Array[String], 
sparkConf: SparkConf)
       .orNull
     // If dynamic allocation is enabled, start at the configured initial 
number of executors.
     // Default to minExecutors if no initialExecutors is set.
-    numExecutors = 
YarnSparkHadoopUtil.getInitialTargetExecutorNumber(sparkConf)
+    numExecutors = 
YarnSparkHadoopUtil.getInitialTargetExecutorNumber(sparkConf, numExecutors)
     principal = Option(principal)
       .orElse(sparkConf.getOption("spark.yarn.principal"))
       .orNull

http://git-wip-us.apache.org/repos/asf/spark/blob/f6680cdc/yarn/src/main/scala/org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala
----------------------------------------------------------------------
diff --git 
a/yarn/src/main/scala/org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala 
b/yarn/src/main/scala/org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala
index 561ad79..a290ebe 100644
--- a/yarn/src/main/scala/org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala
+++ b/yarn/src/main/scala/org/apache/spark/deploy/yarn/YarnSparkHadoopUtil.scala
@@ -392,8 +392,11 @@ object YarnSparkHadoopUtil {
   /**
    * Getting the initial target number of executors depends on whether dynamic 
allocation is
    * enabled.
+   * If not using dynamic allocation it gets the number of executors reqeusted 
by the user.
    */
-  def getInitialTargetExecutorNumber(conf: SparkConf): Int = {
+  def getInitialTargetExecutorNumber(
+      conf: SparkConf,
+      numExecutors: Int = DEFAULT_NUMBER_EXECUTORS): Int = {
     if (Utils.isDynamicAllocationEnabled(conf)) {
       val minNumExecutors = 
conf.getInt("spark.dynamicAllocation.minExecutors", 0)
       val initialNumExecutors =
@@ -406,7 +409,7 @@ object YarnSparkHadoopUtil {
       initialNumExecutors
     } else {
       val targetNumExecutors =
-        
sys.env.get("SPARK_EXECUTOR_INSTANCES").map(_.toInt).getOrElse(DEFAULT_NUMBER_EXECUTORS)
+        
sys.env.get("SPARK_EXECUTOR_INSTANCES").map(_.toInt).getOrElse(numExecutors)
       // System property can override environment variable.
       conf.getInt("spark.executor.instances", targetNumExecutors)
     }


---------------------------------------------------------------------
To unsubscribe, e-mail: commits-unsubscr...@spark.apache.org
For additional commands, e-mail: commits-h...@spark.apache.org

spark git commit: [SPARK-11555] spark on yarn spark-class --num-workers doesn't work

Reply via email to