Re: 请教集群稳定性问题

2019-05-14 文章 naisili Yuan
pClassLoader.loadClass(Launcher.java:349) > at java.lang.ClassLoader.loadClass(ClassLoader.java:357) > ... 49 more > 而本身yarn和hadoop进程都是启动起来ok的,jps显示如下: > 22019 QuorumPeerMain > 1971 Jps > 24452 ResourceManager > 24885 DataNode > 29788 HMaster > 24687 NameNode > 29951 HRegio

回复: 请教集群稳定性问题

2019-05-12 文章 liu_mingzhang
道: 心跳超时的话,先看一下AM和TM的内存使用情况,看下GC Log有没有长时间的GC。 -- From:naisili Yuan Send Time:2019 May 10 (Fri.) 09:34 To:user-zh Subject:请教集群稳定性问题 我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的: org.apache.flink.util.FlinkException

Re: 请教集群稳定性问题

2019-05-11 文章 naisili Yuan
的GC。 > > > -- > From:naisili Yuan > Send Time:2019 May 10 (Fri.) 09:34 > To:user-zh > Subject:请教集群稳定性问题 > > 我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的: > > org.apache.flink.util.FlinkException: The assigned slot

Re: 请教集群稳定性问题

2019-05-09 文章 Yun Gao
心跳超时的话,先看一下AM和TM的内存使用情况,看下GC Log有没有长时间的GC。 -- From:naisili Yuan Send Time:2019 May 10 (Fri.) 09:34 To:user-zh Subject:请教集群稳定性问题 我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的: org.apache.flink.util.FlinkException

请教集群稳定性问题

2019-05-09 文章 naisili Yuan
我的集群配置的是内存checkpoint,自动重启,但是经常跑了一晚上就自动重启,重启的原因日志是这样的: org.apache.flink.util.FlinkException: The assigned slot f6b9b4065386152879a01dfc7d396f42_1 was removed. at org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.removeSlot(SlotManager.java:893) at