flink cdc是否可以以配置的方式来实现在全量读取时,不阻塞chk来实现at least once,结合hudi的upsert语义,最终实现exactly once.
问题: 在使用flink cdc写入hudi时,由于hudi的flush to storage需要在chk触发,因此在大表全量同步期间,没有chk的所有的数据积攒在内存中导致Caused by: java.lang.OutOfMemoryError: GC overhead limit exceeded. 期望: flink cdc是否可以以配置的方式来实现在全量读取时,不阻塞chk来实现at least once,结合hudi的upsert语义,最终实现exactly once. -- Sent from: http://apache-flink.147419.n8.nabble.com/