Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-25 文章 Storm☀️
在测试环境: 关闭增量chk,全量的state大小大约在:100M左右; 之前开启:我观察了一段时间,膨胀到5G,而且还一直在增长; sql: select sum(xx) group by 1 分钟窗口 过期时间设置的为:5-30min -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-23 文章 Yun Tang
@flink.apache.org Subject: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 唐云大佬好, 我关闭了chk的增量模式之后,chkstate确实不会再无线膨胀了。这个是我配置的不准确,还是一个已知问题呢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-22 文章 Storm☀️
唐云大佬好, 我关闭了chk的增量模式之后,chkstate确实不会再无线膨胀了。这个是我配置的不准确,还是一个已知问题呢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-22 文章 Storm☀️
"计算机的解决方案是 出现问题,大都是保护现场,等问题解决后,释放现场 " 那么解决问题的方法是?生产上state还在不断膨胀。 简单一个问题,生产上发生OOM了,短时间内无法排查出原因,请问如何处理? -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-18 文章 r pp
一般性的推断是,模式 是属于配置项,若出现问题了,系统读取 或者 改变 配置项,能解决问题么? 之前的学习经验,计算机的解决方案是 出现问题,大都是保护现场,等问题解决后,释放现场。 状态 可以 类比是现场,当问题出现的时候,重点在状态的保护是怎么实现的,和配置没有太大关系,因为完全可以不读取配置。 配置项是面向用户选择 state 的方式,不是解决问题的方式 Storm☀️ 于2020年12月18日周五 上午11:50写道: > state.backend.incremental 出现问题的时候增量模式是开启的吗? > > > > -- > Sent from: http://apa

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-18 文章 r pp
一般性的推断是,模式 是属于配置项,若出现问题了,系统读取 或者 改变 配置项,能解决问题么? 之前的学习经验,计算机的解决方案是 出现问题,大都是保护现场,等问题解决后,释放现场。 状态 可以 类比是现场,当问题出现的时候,重点在状态的保护是怎么实现的,和配置没有太大关系,因为完全可以不读取配置。 配置项是面向用户选择 state 的方式,不是解决问题的方式。 Storm☀️ 于2020年12月18日周五 上午11:50写道: > state.backend.incremental 出现问题的时候增量模式是开启的吗? > > > > -- > Sent from: http://ap

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-12-17 文章 Storm☀️
state.backend.incremental 出现问题的时候增量模式是开启的吗? -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-30 文章 Danny Chan
能否提供下完整的 query,方便追踪和排查 ~ Best, Danny Chan 在 2020年8月31日 +0800 AM10:58,zhuyuping <1050316...@qq.com>,写道: > 同样出现了这个问题,SQL 使用中,请问是什么原因,翻转tumble窗口当使用mapview 进行操作时候,状态不断的增长 > 好像不能清理一样,因为正常的window 窗口 窗口结束后会清理状态,现在的情况是1秒的翻转tumble窗口,满满的从最开始的1m 过一个小时变成了1g > 不断的无限增长下去 > > > > -- > Sent from: http

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-30 文章 zhuyuping
同样出现了这个问题,SQL 使用中,请问是什么原因,翻转tumble窗口当使用mapview 进行操作时候,状态不断的增长 好像不能清理一样,因为正常的window 窗口 窗口结束后会清理状态,现在的情况是1秒的翻转tumble窗口,满满的从最开始的1m 过一个小时变成了1g 不断的无限增长下去 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-30 文章 zhuyuping
我这边出现同样的问题,我换成了filesystem 发现state 还是一样缓慢增大,所以应该跟rocksdb 无关 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-30 文章 zhuyuping
我也出现了这个问题, 我使用的是窗口函数进行group by 发现state 不会清空,还是10m 到后面 几G 缓慢增长,大概每3个checkpoint 增长 任务没有反压。为了测试我使用discardSi

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-09 文章 Yun Tang
/Leveled-Compaction#structure-of-the-files [2] http://www.leviathan.vip/2018/03/05/Rocksdb%E7%9A%84Compact/ 祝好 唐云 From: chengyanan1...@foxmail.com Sent: Friday, August 7, 2020 10:32 To: user-zh Subject: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 HI

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-09 文章 Congxian Qiu
-- 原始邮件 -- > 发件人: > "user-zh" > < > qcx978132...@gmail.com>; > 发送时间: 2020年8月6日(星期四) 中午1:51 > 收件人: "user-zh" > 主题:

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-06 文章 chengyanan1...@foxmail.com
HI: 请问这个问题有合理的解释吗,持续关注中。。。 发件人: 鱼子酱 发送时间: 2020-08-03 13:50 收件人: user-zh 主题: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 hi,您好: 我改回增量模式重新收集了一些数据: 1、数据处理速度:3000条每秒,是测试环境的,压力比较稳定,几乎没有波动 2、checkpoint是interval设置的是5秒 3、目前这个作业是每分钟一个窗口 4、并行度设置的1,使用on-yarn模式 刚启动的时候,如下: <http://apa

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-06 文章 Yu Li
"user-zh" > < > car...@gmail.com>; > 发送时间: 2020年8月6日(星期四) 下午4:01 > 收件人: "user-zh" > 主题: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 > > > > @鱼子酱 > > 请问同样的作业,

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-06 文章 Yu Li
人:* "user-zh" ; > > *发送时间:* 2020年8月5日(星期三) 下午5:43 > > *收件人:* "user-zh"; > > *主题:* Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 > > > > Hi > > RocksDB StateBackend 只需要在 flink-conf 中进行一下配置就行了[1]. > > > > 另外从你前面两份邮件看,我有些信息比较疑

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-05 文章 Congxian Qiu
20年8月5日(星期三) 下午5:43 > *收件人:* "user-zh"; > *主题:* Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 > > Hi > RocksDB StateBackend 只需要在 flink-conf 中进行一下配置就行了[1]. > > 另外从你前面两份邮件看,我有些信息比较疑惑,你能否贴一下现在使用的 flink-conf,以及 checkpoint UI 的截图,以及 HDFS > 上 checkpoint 目录

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-05 文章 Congxian Qiu
< > qcx978132...@gmail.com>; > 发送时间: 2020年8月5日(星期三) 下午3:30 > 收件人: "user-zh" > 主题: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 > > > > Hi op >    这个情况比较奇怪。我想确认下: >    1)你所有作业都遇到 checkpoint size 不断变大的情况,还是只有这个类型的作业遇到这个问题呢? >    2

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-05 文章 Congxian Qiu
- 原始邮件 -- > 发件人: > "user-zh" > < > qcx978132...@gmail.com>; > 发送时间: 2020年8月3日(星期一) 下午5:50 > 收件人: "user-zh&quo

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-03 文章 Congxian Qiu
 2020年8月3日(星期一) 中午1:50 > 收件人: "user-zh" > 主题: Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大 > > > > hi,您好: > 我改回增量模式重新收集了一些数据: > 1、数据处理速度:3000条每秒,是测试环境的,压力比较稳定,几乎没有波动 > 2、checkpoint是interval设置的是5秒 > 3、目前这个作业是每分钟一个窗口 > 4、并行度设置的1,使用on-yarn模式 > &g

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-08-02 文章 鱼子酱
hi,您好: 我改回增量模式重新收集了一些数据: 1、数据处理速度:3000条每秒,是测试环境的,压力比较稳定,几乎没有波动 2、checkpoint是interval设置的是5秒 3、目前这个作业是每分钟一个窗口 4、并行度设置的1,使用on-yarn模式 刚启动的时候,如下: 18分钟后,如下: checkpoints设置:

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-30 文章 Congxian Qiu
Hi 鱼子酱 能否把在使用增量 checkpoint 的模式下,截图看一下 checkpoint size 的走势呢?另外可以的话,也麻烦你在每次 checkpoint 做完之后,到 hdfs 上 ls 一下 checkpoint 目录的大小。 另外有一个问题还需要回答一下,你的处理速度大概是多少,state 的更新频率能否评估一下呢? Best, Congxian 鱼子酱 <384939...@qq.com> 于2020年7月30日周四 上午10:43写道: > 感谢! > > flink1.11.1版本里面,我尝试了下面两种backend,目前运行了20多个小

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-29 文章 鱼子酱
感谢! flink1.11.1版本里面,我尝试了下面两种backend,目前运行了20多个小时, 能够看到状态的大小在一个区间内波动,没有发现一直增长的情况了。 StateBackend backend =new RocksDBStateBackend("hdfs:///checkpoints-data/"+yamlReader.getValueByKey("jobName").toString()+"/",false); StateBackend backend =new FsStateBackend("hdfs:///checkpoints-data/"+yamlReader.getV

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-29 文章 鱼子酱
感谢! flink1.11.1版本里面,我尝试了下面两种backend,目前运行了20多个小时, 能够看到状态的大小在一个区间内波动,没有发现一直增长的情况了。 StateBackend backend =new RocksDBStateBackend("hdfs:///checkpoints-data/"+yamlReader.getValueByKey("jobName").toString()+"/",false); StateBackend backend =new FsStateBackend("hdfs:///checkpoints-data/"+yamlReader.get

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-29 文章 鱼子酱
感谢! flink1.11.1版本里面,我尝试了下面两种backend,目前运行了20多个小时, 能够看到状态的大小在一个区间内波动,没有发现一直增长的情况了。 StateBackend backend =new RocksDBStateBackend("hdfs:///checkpoints-data/"+yamlReader.getValueByKey("jobName").toString()+"/",false); StateBackend backend =new FsStateBackend("hdfs:///checkpoints-data/"+yamlRe

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-29 文章 鱼子酱
感谢! flink1.11.1版本里面,我尝试了下面两种backend,目前运行了20多个小时, 能够看到状态的大小在一个区间内波动,没有发现一直增长的情况了。 StateBackend backend =new RocksDBStateBackend("hdfs:///checkpoints-data/"+yamlReader.getValueByKey("jobName").toString()+"/",false); StateBackend backend =new FsStateBackend("hdfs:///checkpoints-data/"+yamlRe

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-28 文章 Dream-底限
hi 鱼子酱、 我当初这样用的时候状态也不清理(子查询+时间窗口+union),后来把时间窗口改成全局group函数,union改成订阅topic列表后,设置状态过期时间状态才清理。。。 后来看资料有的说分区数据不均衡导致水印不推进的话可能导致这种状态不清理的问题,但是我感觉不是水印导致的,水印导致的窗口应该不触发计算吧,感觉这里面有些bug,需要专业人士定位一下 鱼子酱 <384939...@qq.com> 于2020年7月29日周三 上午9:53写道: > 您好: > > 我按照您说的试了看了一下watermark, > 发现可以 正常更新,相关的计算结果也没发现问题。 >

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-28 文章 Benchao Li
这个问题我建议先区分下是SQL operator里面没有清理state,还是state backend本身没有清理state。 这样你是否可以尝试下其他的state backend,以及非增量模式的rocksdb等?如果在所有state backend场景下, state都是一直上涨的,那有可能某个SQL operator里面对state的清理可能有些问题。 鱼子酱 <384939...@qq.com> 于2020年7月29日周三 上午9:47写道: > 您好: > > 我按照您说的试了看了一下watermark, > 发现可以 正常更新,相关的计算结果也没发现问题。 > 1. 刚刚截了

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-28 文章 鱼子酱
您好: 我按照您说的试了看了一下watermark, 发现可以 正常更新,相关的计算结果也没发现问题。 1. 刚刚截了图在下面,时间因为时区的问题-8就正常了 2. checkpoint里面的信息,能看出大小是线性增长的,然后主要集中在2个窗口和group里面。

Re: flink1.10.1/1.11.1 使用sql 进行group 和 时间窗口 操作后 状态越来越大

2020-07-28 文章 Congxian Qiu
Hi SQL 部分不太熟,根据以往的经验,对于 event time 情况下 window 的某个算子 state 越来越大的情况,或许可以检查下 watermark[1] [1] https://ci.apache.org/projects/flink/flink-docs-release-1.11/zh/monitoring/debugging_event_time.html Best, Congxian 鱼子酱 <384939...@qq.com> 于2020年7月28日周二 下午2:45写道: > Hi,社区的各位大家好: > 我目前生产上面使用的是1.8.2版本,