大家好,我kafka中有一批数据,我在统计每个元素30分钟的count值时,发现当我设置不同并行度时,统计结果也不一样,请问应该以什么思路排查比较好


SELECT
    user,
    price,  
    count(id) OVER (
        PARTITION BY user 
        ORDER BY actionTime 
        RANGE BETWEEN INTERVAL '30' MINUTE preceding AND CURRENT ROW) AS c
  FROM kafkaTable;


当并行度等于分区数据,统计结果是最准确的
其次StreamTableEnvironmentAPI中table.exec.source.idle-timeout参数好像不生效?


版本:flink1.11.1


谢谢

回复