pClassLoader.loadClass(Launcher.java:349)
> at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
> ... 49 more
> 而本身yarn和hadoop进程都是启动起来ok的,jps显示如下:
> 22019 QuorumPeerMain
> 1971 Jps
> 24452 ResourceManager
> 24885 DataNode
> 29788 HMaster
> 24687 NameNode
> 29951 HRegio
道:
心跳超时的话,先看一下AM和TM的内存使用情况,看下GC Log有没有长时间的GC。
--
From:naisili Yuan
Send Time:2019 May 10 (Fri.) 09:34
To:user-zh
Subject:请教集群稳定性问题
我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的:
org.apache.flink.util.FlinkException
的GC。
>
>
> --
> From:naisili Yuan
> Send Time:2019 May 10 (Fri.) 09:34
> To:user-zh
> Subject:请教集群稳定性问题
>
> 我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的:
>
> org.apache.flink.util.FlinkException: The assigned slot
心跳超时的话,先看一下AM和TM的内存使用情况,看下GC Log有没有长时间的GC。
--
From:naisili Yuan
Send Time:2019 May 10 (Fri.) 09:34
To:user-zh
Subject:请教集群稳定性问题
我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的:
org.apache.flink.util.FlinkException
我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的:
org.apache.flink.util.FlinkException: The assigned slot
f6b9b4065386152879a01dfc7d396f42_1 was removed.
at
org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.removeSlot(SlotManager.java:893)
at