checkpoint原理和2pc原理

zyzandmz Sun, 20 Aug 2023 04:35:33 -0700


问题一：
做checkpoint时，是每个算子收到barriers之后，将状态和offset写到状态后端，并返回ack给jm之后。再做一次全量快照到jm内存或者自己设置的hdfs文件路径下啊。不理解在hdfs生成的checkpoint文件到底是2pc提交事务成功之后的checkpoint还是每个算子做完checkpoint。


是图1：


还是图二：


问题二：
做完2pc之后。出现了故障。做故障恢复。恢复的状态是上一次提交事务成功的地方的状态。还是上一个barriers所在算子做的checkpoint成功的地方开始恢复。


| |
zyzandmz
|
|
zyzan...@163.com
|

checkpoint原理和2pc原理

回复