如题。 我理解对于写文件类型OutputFormat,用这两个方法在jobmanager里面在任务开始前删除/创建文件夹,在任务结束后把文件移动到正式目录,使文件可见。 但是比如对于RDB类型的InputFormat,如果也能用这两个接口,那么比如说在任务开始前查询当前数据库的记录数,这样对于构建数据分片做多通道,以及增加执行进度指标都很有帮助。
-- Sent from: http://apache-flink.147419.n8.nabble.com/
如题。 我理解对于写文件类型OutputFormat,用这两个方法在jobmanager里面在任务开始前删除/创建文件夹,在任务结束后把文件移动到正式目录,使文件可见。 但是比如对于RDB类型的InputFormat,如果也能用这两个接口,那么比如说在任务开始前查询当前数据库的记录数,这样对于构建数据分片做多通道,以及增加执行进度指标都很有帮助。
-- Sent from: http://apache-flink.147419.n8.nabble.com/