Re: Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 yidan zhao
主要是窗口触发导致CPU尖刺比较麻烦,如果能平滑占用CPU总体上会得到更好的效果应该。

东东  于2021年8月31日周二 下午3:38写道:

> 本质上是流里的数据量伸缩比较大导致的吧,感觉你去自定义source做下限流是不是更优雅一些。
>
>
> 不过说到底流式处理一般是对延迟比较敏感,恨不得用上所有资源让延迟最小化,你这里貌似对资源更敏感。。。
>
>
> 在 2021-08-31 15:19:01,"yidan zhao"  写道:
> >不过目前我覆盖实现过很多flink的api,都很难受,因为各种要么private,要么没有get/set,导致只能覆盖实现。没办法继承调整部分实现。
> >
> >刚刚看了下,这个思路实现的话,目前需要自定义个 window 类,不使用
> >TimeWindow,需要在window中记录下触发时间,否则trigger的onEventTime方法回调中没办法确认是否当前元素的触发时机。
>
> >或者triggerContext提供currentKey,但我看了TriggerContext中有key,但是没提供getCurrentKey方法,导致。。。
> >
> >yidan zhao  于2021年8月31日周二 下午3:16写道:
> >
> >> cpu尖刺平滑呀。
> >>
> >> Shuo Cheng  于2021年8月31日周二 下午3:14写道:
> >>
> >>> 这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?
> >>>
> >>> On 8/31/21, yidan zhao  wrote:
> >>> > 如题,我目前计划自定义event time trigger实现分散触发。
> >>> > 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
> >>> > 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
> >>> >
> >>> > 不知道想法是否OK呢?
> >>> >
> >>>
> >>
>


Re:Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 东东
本质上是流里的数据量伸缩比较大导致的吧,感觉你去自定义source做下限流是不是更优雅一些。


不过说到底流式处理一般是对延迟比较敏感,恨不得用上所有资源让延迟最小化,你这里貌似对资源更敏感。。。


在 2021-08-31 15:19:01,"yidan zhao"  写道:
>不过目前我覆盖实现过很多flink的api,都很难受,因为各种要么private,要么没有get/set,导致只能覆盖实现。没办法继承调整部分实现。
>
>刚刚看了下,这个思路实现的话,目前需要自定义个 window 类,不使用
>TimeWindow,需要在window中记录下触发时间,否则trigger的onEventTime方法回调中没办法确认是否当前元素的触发时机。
>或者triggerContext提供currentKey,但我看了TriggerContext中有key,但是没提供getCurrentKey方法,导致。。。
>
>yidan zhao  于2021年8月31日周二 下午3:16写道:
>
>> cpu尖刺平滑呀。
>>
>> Shuo Cheng  于2021年8月31日周二 下午3:14写道:
>>
>>> 这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?
>>>
>>> On 8/31/21, yidan zhao  wrote:
>>> > 如题,我目前计划自定义event time trigger实现分散触发。
>>> > 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
>>> > 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
>>> >
>>> > 不知道想法是否OK呢?
>>> >
>>>
>>


Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 yidan zhao
目前实现了基于offset分散的cpu尖刺解决方案,但是改方案需要业务统一语义变更。比如基于ip的5min统计,我通过hash将不同ip哈希得到不同offset,使用滚动5min窗口+hash到的offset分窗,效果OK。
但如果部分业务不希望窗口上加offset,就需要如上最初想的这个方案了。

yidan zhao  于2021年8月31日周二 下午3:19写道:

> 不过目前我覆盖实现过很多flink的api,都很难受,因为各种要么private,要么没有get/set,导致只能覆盖实现。没办法继承调整部分实现。
>
> 刚刚看了下,这个思路实现的话,目前需要自定义个 window 类,不使用
> TimeWindow,需要在window中记录下触发时间,否则trigger的onEventTime方法回调中没办法确认是否当前元素的触发时机。
>
> 或者triggerContext提供currentKey,但我看了TriggerContext中有key,但是没提供getCurrentKey方法,导致。。。
>
> yidan zhao  于2021年8月31日周二 下午3:16写道:
>
>> cpu尖刺平滑呀。
>>
>> Shuo Cheng  于2021年8月31日周二 下午3:14写道:
>>
>>> 这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?
>>>
>>> On 8/31/21, yidan zhao  wrote:
>>> > 如题,我目前计划自定义event time trigger实现分散触发。
>>> > 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
>>> > 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
>>> >
>>> > 不知道想法是否OK呢?
>>> >
>>>
>>


Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 yidan zhao
不过目前我覆盖实现过很多flink的api,都很难受,因为各种要么private,要么没有get/set,导致只能覆盖实现。没办法继承调整部分实现。

刚刚看了下,这个思路实现的话,目前需要自定义个 window 类,不使用
TimeWindow,需要在window中记录下触发时间,否则trigger的onEventTime方法回调中没办法确认是否当前元素的触发时机。
或者triggerContext提供currentKey,但我看了TriggerContext中有key,但是没提供getCurrentKey方法,导致。。。

yidan zhao  于2021年8月31日周二 下午3:16写道:

> cpu尖刺平滑呀。
>
> Shuo Cheng  于2021年8月31日周二 下午3:14写道:
>
>> 这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?
>>
>> On 8/31/21, yidan zhao  wrote:
>> > 如题,我目前计划自定义event time trigger实现分散触发。
>> > 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
>> > 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
>> >
>> > 不知道想法是否OK呢?
>> >
>>
>


Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 yidan zhao
cpu尖刺平滑呀。

Shuo Cheng  于2021年8月31日周二 下午3:14写道:

> 这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?
>
> On 8/31/21, yidan zhao  wrote:
> > 如题,我目前计划自定义event time trigger实现分散触发。
> > 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
> > 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
> >
> > 不知道想法是否OK呢?
> >
>


Re: 是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 Shuo Cheng
这样做是要达到设么目的呢? 目前的触发机制以及 early/late fire 满足不了需求么?

On 8/31/21, yidan zhao  wrote:
> 如题,我目前计划自定义event time trigger实现分散触发。
> 比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
> 同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。
>
> 不知道想法是否OK呢?
>


是否可以自定义trigger实现event time window的分散触发

2021-08-31 文章 yidan zhao
如题,我目前计划自定义event time trigger实现分散触发。
比如0-5的窗口分散到6-11分触发, 从6开始是因为本身有个1min的乱序处理。
同时配合将allowedlateness设置为5min,这样避免窗口状态在触发之前被clean。

不知道想法是否OK呢?