我是直接监控kafka的lag,如果lag数值较大或持续上升,肯定就有延迟了。收到告警后,再查看下plan,有个busy指标,红色的节点就是有问题的








在 2021-12-23 08:36:33,"casel.chen" <casel_c...@126.com> 写道:
>想问一下flink sql作业链路延迟监控如何实现?
>我们的flink 
>sql作业基本上都是上游接kafka,下游sink到es/hbase/kafka/mongodb/redis/clickhouse/doris这些存储
>想监控如下三种延迟,目前有什么办法实现吗?会有相应的metrics暴露出来吗?目前我们在用的flink版本是1.13.2
>1. 端到端的延迟
>2. kafka本身的延迟
>3. flink处理的延迟

回复