可能存在机器压力倾斜,但是我是不太清楚这种现象的原因,直接停滞了任务?

东东 <dongdongking...@163.com> 于2021年8月26日周四 上午11:06写道:

> 建议检查一下是否有数据倾斜
>
>
> 在 2021-08-26 10:22:54,"yidan zhao" <hinobl...@gmail.com> 写道:
> >问题期间的确ckpt时间较长。
> >但是,这个任务正常ckpt时间才不到1s,ckpt大小也就21MB,所以也很难说ckpt为啥会超时,我超时设置的2min。
> >
> >Caizhi Weng <tsreape...@gmail.com> 于2021年8月26日周四 上午10:20写道:
> >
> >> Hi!
> >>
> >> 从图中情况来看很可能是因为下游 checkpoint 时间过长导致反压上游。是否观察过 checkpoint 的情况?
> >>
> >> yidan zhao <hinobl...@gmail.com> 于2021年8月26日周四 上午10:09写道:
> >>
> >> > 如题,这个问题以前遇到过,后来发生频率低了,近期又多了几次,下面是具体的话题讨论,email不方便贴图。
> >> >
> >> > 语雀:https://www.yuque.com/sixhours-gid0m/ls9vqu/rramvh
> >> >
> >>
>

回复