我再次确认了一下,可能是因为我设置了checkpoint的setMinPauseBetweenCheckpoints,所以在上一次 checkpoint 和这个间隔之间触发 savepoint 不会生效,但是接口返回了IN_PROGRESS 的状态,我觉得这里应该是有点问题的。
原始邮件 发件人: taowang<taow...@deepglint.com> 收件人: user-zh<user-zh@flink.apache.org> 发送时间: 2020年7月28日(周二) 18:53 主题: Re: flink 1.11 rest api saveppoint接口 异常 是的,其实无论是否开启了unaligned checkpoint,我在调用这个接口的时候都没有 checkpoint 在做。 而且等待的话,我认为如果有正在做的,那么正在做的 checkpoint执行完成之后新的 savepoint 应该会开始执行吧,但我看到的现象是等了半个小时依旧是 IN_PROGRESS状态,正常状态下,一个 checkpoint 的执行时间也就几秒钟,正常的 savpoint 执行完成最多也只需要几分钟。 原始邮件 发件人: Congxian Qiu<qcx978132...@gmail.com> 收件人: user-zh<user-zh@flink.apache.org> 发送时间: 2020年7月28日(周二) 18:09 主题: Re: flink 1.11 rest api saveppoint接口 异常 Hi 开启 unalign checkpoint 的情况下,如果有 checkpoint 正在做的话,那么 savepoint 会等待的[1],但是把 unaligned checkpoint 关闭之后,还有这个现象看上去不太符合预期。关闭之后这种现象出现的时候,也有 checkpoint 正在做吗? [1] https://issues.apache.org/jira/browse/FLINK-17342 Best, Congxian taowang <taow...@deepglint.com> 于2020年7月28日周二 下午5:05写道: > 在升级了 flink 1.11之后,我在使用的时候发现 rest api 的 /jobs/:jobid/savepoints 接口表现有点异常: > 在 flink 1.10 时:当请求该接口后,在 flink ui 可以看到 savepoint > 被触发,/jobs/:jobid/savepoints/:triggerid 返回IN_PROGRESS,等 savepoint > 成功之后jobs/:jobid/savepoints/:triggerid返回COMPLETED。 > 但是在flink 1.11中:经常出现(不是必现,但是概率也不低) /jobs/:jobid/savepoints > 接口正常返回,/jobs/:jobid/savepoints/:triggerid 也返回IN_PROGRESS,但是在flink ui 中看不到 > savepoint 被触发,而且/jobs/:jobid/savepoints/:triggerid 一直返回IN_PROGRESS。 > 我怀疑这个是不是和我开了 unaligned checkpoint 有关,但是我在 > flink-config.yaml中把execution.checkpointing.unaligned设置为false还是会出现这种问题,请问大家有什么了解吗? > > > rest api flink docs 链接: > https://ci.apache.org/projects/flink/flink-docs-release-1.11/monitoring/rest_api.html#jobs-jobid-savepoints > > > 祝好~