Re: Flink Job 监控

2019-03-28 文章 Biao Liu
; > 如果是使用flink集成cluster可以监控flink的job state,如果是yarn是超脱模式可以监控yarn的状态。 > > > > > > > > > > -- 原始邮件 -- > > 发件人: "cheng"; > > 发送时间: 2019年3月28日(星期四) 下午4:38 > > 收件人: "user-zh"; > > > > 主题: Flink

Re: Flink Job 监控

2019-03-28 文章 cheng
quot;; > 发送时间: 2019年3月28日(星期四) 下午4:38 > 收件人: "user-zh"; > > 主题: Flink Job 监控 > > > > 各位好! > 请教下各位,Flink Job 在生产上运行时,关于job运行状态的监控和告警一般是采用什么方案处理的? > 比如监控job是否在正常运行,如果发现job 挂掉了 或者重启了 就进行告警。我这边有将一些metric 推到prometheus > 但是好像没有发现关于job是否挂掉的metric。 > 希望有做过这种方案的朋友能赐教下,谢谢了!!

Flink Job 监控

2019-03-28 文章 cheng
各位好! 请教下各位,Flink Job 在生产上运行时,关于job运行状态的监控和告警一般是采用什么方案处理的? 比如监控job是否在正常运行,如果发现job 挂掉了 或者重启了 就进行告警。我这边有将一些metric 推到prometheus 但是好像没有发现关于job是否挂掉的metric。 希望有做过这种方案的朋友能赐教下,谢谢了!!

Flink Job 监控

2019-03-28 文章 cheng
各位好! 请教下各位,Flink Job 在生产上运行时,关于job运行状态的监控和告警一般是采用什么方案处理的? 比如监控job是否在正常运行,如果发现job 挂掉了 或者重启了 就进行告警。我这边有将一些metric 推到prometheus 但是好像没有发现关于job是否挂掉的metric。 希望有做过这种方案的朋友能赐教下,谢谢了!!