Hi
   比较好奇你为什么在 Blink 分支做测试,而不是用最新的 1.11 做测试呢?
Best,
Congxian


柯四海 <2693711...@qq.com> 于2020年8月24日周一 下午5:58写道:

> Hi 大家好,
> 我用github上Blink分支(1.5)编译的flink来运行一些实时任务,发现Taskmanager
> 因为内存超了container限制被yarn kill.
> 有没有人有比较好的问题定位方案?
>
> 尝试过但是还没有解决问题的方法:
>   1. 尝试增加taskmanager内存
>         修改: 从8G 提高到 36G, state back  从fileSystem 改为RocksDB.
>         现象:taskmanager运行时间增加了好几个小时,但是还是因为内存超了被yarn kill.
>   2. dump taskmanager 堆栈,查看什么对象占用大量内存
>        操作: jmap -dump ....
>        现象: 还没有dump结束,taskmanager就因为没有heartbeat 被主动kill.
> (尝试过修改heartbeat时间,还是无果)
>   3. 借用官网debug方式,如下,但是没有dump出文件.
>    4. 设置containerized.heap-cutoff-ratio,希望触发 oom 从而产生dump文件,但是这个参数似乎不起作用.
>

回复