回复: 关于窗口计算,数据不连续,导致窗口延迟触发的问题。

2021-11-03 文章 wang edmond
你好: 可以设置水位线的生成的空闲时间,超过空闲时间没有事件也会生成水位线。 可以参见官方文档中的 Dealing With Idle Sourcces部分 https://nightlies.apache.org/flink/flink-docs-release-1.14/docs/dev/datastream/event-time/generating_watermarks/ Generating Watermarks | Apache Flink

Re: flinkSQL写hive表,timestamp-pattern设置,分区是yyyyMMdd而不是yyyy-MM-dd的情况怎么搞。

2021-11-03 文章 Jingsong Li
你可以自定义个partition.time-extractor.class来自己解析 Flink应该搞个对应的partition.time-extractor.kind来默认支持你的需求。 建了个JIRA: https://issues.apache.org/jira/browse/FLINK-24758 Best, Jingsong On Thu, Nov 4, 2021 at 11:47 AM yidan zhao wrote: > > 如题,我当前是select date_format(xxx, 'MMdd') as dt... > > partition.time-e

flinkSQL写hive表,timestamp-pattern设置,分区是yyyyMMdd而不是yyyy-MM-dd的情况怎么搞。

2021-11-03 文章 yidan zhao
如题,我当前是select date_format(xxx, 'MMdd') as dt... partition.time-extractor.timestamp-pattern是$dt $hour:00:00这样。 但是这样会导致报错,貌似这个地方必须是 -MM-dd hh:mm:ss这种吗。

Re: 退订

2021-11-03 文章 Leonard Xu
如果需要取消订阅 user-zh@flink.apache.org 邮件组,请发送任意内容的邮件到 user-zh-unsubscr...@flink.apache.org > 在 2021年11月2日,14:15,李芳奎 写道: > > 退订 > > felix > > felix_...@163.com

Re: 关于窗口计算,数据不连续,导致窗口延迟触发的问题。

2021-11-03 文章 Gen Luo
WatermarkGenerator接口有onEvent和onPeriodicEmit, onPeriodicEmit 会周期性调用,可能可以在这里实现一个多长时间没有调onEvent就发一个计算出来的新的watermark的逻辑,新的watermark比当前的watermark对应的窗口时间都更晚应该就能触发所有窗口了 On Mon, Nov 1, 2021 at 5:20 PM yuankuo.xia wrote: > hi > > > 背景:我在使用eventTime窗口进行聚合计算,但是数据不连续,比如:A,B时间段之内都有数据流入,但A时间段和B时间段中间有30分钟无数据流入

回复:关于窗口计算,数据不连续,导致窗口延迟触发的问题。

2021-11-03 文章 罗根(夕肆)
WatermarkGenerator接口有onEvent和onPeriodicEmit, onPeriodicEmit会周期性调用,可能可以在这里实现一个多长时间没有调onEvent就发一个计算出来的新的watermark的逻辑,新的watermark比当前的watermark对应的窗口时间都更晚应该就能触发所有窗口了 -- 发件人:yuankuo.xia 发送时间:2021年11月1日(星期一) 17:20 收件人:user-zh 主 题:关于窗口计算,