[GitHub] spark pull request #22954: [SPARK-25981][R] Enables Arrow optimization from ...

viirya Mon, 12 Nov 2018 03:20:17 -0800

Github user viirya commented on a diff in the pull request:

    https://github.com/apache/spark/pull/22954#discussion_r232620582
  
    --- Diff: sql/core/src/main/scala/org/apache/spark/sql/api/r/SQLUtils.scala 
---
    @@ -225,4 +226,25 @@ private[sql] object SQLUtils extends Logging {
         }
         sparkSession.sessionState.catalog.listTables(db).map(_.table).toArray
       }
    +
    +  /**
    +   * R callable function to read a file in Arrow stream format and create 
an `RDD`
    +   * using each serialized ArrowRecordBatch as a partition.
    +   */
    +  def readArrowStreamFromFile(
    +      sparkSession: SparkSession,
    +      filename: String): JavaRDD[Array[Byte]] = {
    +    ArrowConverters.readArrowStreamFromFile(sparkSession.sqlContext, 
filename)
    +  }
    +
    +  /**
    +   * R callable function to read a file in Arrow stream format and create 
a `DataFrame`
    --- End diff --
    
    Is this going to read a file in Arrow stream format?



---

---------------------------------------------------------------------
To unsubscribe, e-mail: reviews-unsubscr...@spark.apache.org
For additional commands, e-mail: reviews-h...@spark.apache.org

[GitHub] spark pull request #22954: [SPARK-25981][R] Enables Arrow optimization from ...

Reply via email to