[GitHub] spark pull request #23217: [SPARK-25829][SQL][FOLLOWUP] Refactor MapConcat i...

cloud-fan Tue, 04 Dec 2018 07:03:34 -0800

Github user cloud-fan commented on a diff in the pull request:

    https://github.com/apache/spark/pull/23217#discussion_r238698103
  
    --- Diff: 
sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/util/ArrayBasedMapBuilder.scala
 ---
    @@ -47,13 +48,17 @@ class ArrayBasedMapBuilder(keyType: DataType, 
valueType: DataType) extends Seria
       private lazy val keyGetter = InternalRow.getAccessor(keyType)
       private lazy val valueGetter = InternalRow.getAccessor(valueType)
     
    -  def put(key: Any, value: Any): Unit = {
    +  def put(key: Any, value: Any, withSizeCheck: Boolean = false): Unit = {
         if (key == null) {
           throw new RuntimeException("Cannot use null as map key.")
         }
     
         val index = keyToIndex.getOrDefault(key, -1)
         if (index == -1) {
    +      if (withSizeCheck && size >= 
ByteArrayMethods.MAX_ROUNDED_ARRAY_LENGTH) {
    --- End diff --
    
    hmmm, I'd like to avoid premature optimization. Actually how much perf this 
can save? This code block is already doing some heavy work.



---

---------------------------------------------------------------------
To unsubscribe, e-mail: reviews-unsubscr...@spark.apache.org
For additional commands, e-mail: reviews-h...@spark.apache.org

[GitHub] spark pull request #23217: [SPARK-25829][SQL][FOLLOWUP] Refactor MapConcat i...

Reply via email to