Hi casel.chan:
 请问你是sink端数据不均衡还是source端数据不均衡。
 如果是写入端 ,看看你是否自定义了分区字段,flink 默认是策略应该不会造成数据不均衡,但是无法保证 分区有序性。同时也可以关注下 下游消费者 
是否会有消费不同分区 处理性能不同问题。



---
Best,
WuKong
 
发件人: casel.chen
发送时间: 2021-10-29 09:30
收件人: user-zh@flink.apache.org
主题: flink sql消费kafka各分区消息不均衡问题
flink 
sql消费kafka消息做数据同步,前期没有出现堆积不均的问题,这两天发现某些kafka分区积压特别多,会是什么原因造成的?怎样解决呢?从统计结果上看,消息还算均匀地打到各个kafka分区上。作业没有开窗和聚合,只是攒一批写一批这样子的。注:作业是跑在k8s上的
 
 
| 分区 ID | 客户端 | 最大位点 | 消费位点 | 堆积量 |
| 0 | n/a | 155,397,108 | 155,396,747 | 361 |
| 1 | n/a | 155,215,444 | 155,215,108 | 336 |
| 2 | n/a | 155,369,596 | 155,369,258 | 338 |
| 3 | n/a | 155,422,750 | 155,422,337 | 413 |
| 4 | n/a | 155,163,343 | 154,489,738 | 673,605 |
| 5 | n/a | 155,401,388 | 154,702,173 | 699,215 |
| 6 | n/a | 155,372,040 | 154,651,398 | 720,642 |
| 7 | n/a | 155,208,461 | 154,528,301 | 680,160 |
| 8 | n/a | 155,383,486 | 154,696,404 | 687,082 |
| 9 | n/a | 155,391,068 | 154,668,426 | 722,642 |
| 10 | n/a | 155,139,417 | 154,450,377 | 689,040 |
| 11 | n/a | 155,411,848 | 155,411,518 | 330 |
 

回复