我是直接监控kafka的lag,如果lag数值较大或持续上升,肯定就有延迟了。收到告警后,再查看下plan,有个busy指标,红色的节点就是有问题的
在 2021-12-23 08:36:33,"casel.chen" <casel_c...@126.com> 写道: >想问一下flink sql作业链路延迟监控如何实现? >我们的flink >sql作业基本上都是上游接kafka,下游sink到es/hbase/kafka/mongodb/redis/clickhouse/doris这些存储 >想监控如下三种延迟,目前有什么办法实现吗?会有相应的metrics暴露出来吗?目前我们在用的flink版本是1.13.2 >1. 端到端的延迟 >2. kafka本身的延迟 >3. flink处理的延迟