subject:"foreachPartition in Spark Java API"

Re: foreachPartition in Spark Java API

2017-05-30 Thread Anton Kravchenko

//ForEachPartFunction.java: import org.apache.spark.api.java.function.ForeachPartitionFunction; import org.apache.spark.sql.Row; import java.util.ArrayList; import java.util.Iterator; import java.util.List; public class ForEachPartFunction implements ForeachPartitionFunction{ public void

Re: foreachPartition in Spark Java API

2017-05-30 Thread Anton Kravchenko

Ok, there are at least two ways to do it: Dataset df = spark.read.csv("file:///C:/input_data/*.csv") df.foreachPartition(new ForEachPartFunction()); df.toJavaRDD().foreachPartition(new Void_java_func()); where ForEachPartFunction and Void_java_func are defined below: //

foreachPartition in Spark Java API

2017-05-30 Thread Anton Kravchenko

What would be a Java equivalent of the Scala code below? def void_function_in_scala(ipartition: Iterator[Row]): Unit ={ var df_rows=ArrayBuffer[String]() for(irow<-ipartition){ df_rows+=irow.toString } val df = spark.read.csv("file:///C:/input_data/*.csv")

Re: foreachPartition in Spark Java API

Re: foreachPartition in Spark Java API

foreachPartition in Spark Java API

3 matches

Site Navigation

Mail list logo

Footer information