FlinkSQL over PARTITION BY窗口不同并行度计算结果不同

Num Tue, 08 Jun 2021 06:08:38 -0700


大家好，我kafka中有一批数据，我在统计每个元素30分钟的count值时，发现当我设置不同并行度时，统计结果也不一样，请问应该以什么思路排查比较好



SELECT
    user,
    price,  
    count(id) OVER (
        PARTITION BY user 
        ORDER BY actionTime 
        RANGE BETWEEN INTERVAL '30' MINUTE preceding AND CURRENT ROW) AS c
  FROM kafkaTable;


当并行度等于分区数据，统计结果是最准确的
其次StreamTableEnvironmentAPI中table.exec.source.idle-timeout参数好像不生效？


版本：flink1.11.1


谢谢

FlinkSQL over PARTITION BY窗口不同并行度计算结果不同

回复