Re:几个Flink 1.12. 2超时问题

Ye Chen Mon, 02 Aug 2021 23:41:24 -0700

你好，
请问一下为什么要设置128并行度，这个数值有点太大了，出于什么考虑设置的







在 2021-08-03 14:02:53，"Chenyu Zheng" <chenyu.zh...@hulu.com.INVALID> 写道：

开发者您好，

 

我正在尝试在Kubernetes上部署Flink 1.12.2，使用的是native 
application部署模式。但是在测试中发现，当将作业并行度调大之后，各种timeout时有发生。根据监控看，JM和TM容器的cpu和内存都没有使用到k8s给分配的量。

 

在尝试调大akka.ask.timeout至1分钟，和heartbeat.timeout至2分钟之后，各种超时现象得以缓解。

 

我的问题是，当设置较大并行度（比如128）时，akka超时和心跳超时的各种现象都是正常的吗？如果不正常，需要用什么方式去troubleshot问题的根源呢？另外单纯一味调大各个组件的超时时间，会带来什么负面作用呢？

 

附件中有akka超时的jobmanager日志，TaskManager心跳超时日志稍后会发上来。

 

谢谢！

Re:几个Flink 1.12. 2超时问题

回复