from:"熊云昆"

Re:Re: 关于TableAPI的filesystem中compact功能

2021-11-23 文章熊云昆

应该不行，rocksdb本身自己会删除废弃的文件的，不需要你自己再去删除，而且你自己删除很容易误删文件导致异常在 2021-11-23 19:07:28，"yidan zhao" 写道： >这个有懂的吗，本质需求是我需要做一个后台脚本，去安全的删除废弃的文件。 > >此外，目前还衍生一个需求是，我停止任务，拿到保存点，但任务还没停止。 >我马上重启任务基于保存点，这部分我认为没问题，但之前那个没停止的任务我在想，是不是不能强制停，否则会导致部分文件无compact？ > >yidan zhao 于2021年11月20日周六下午8:15写道： >

Re:KafkaSource检查点的end to end duration较长（1min）原因

2021-06-21 文章熊云昆

我觉得问题是不是出在反压上面，你的job是不是有反压？在 2021-06-21 10:38:36，"yidan zhao" 写道： >如题，我任务的检查点（对齐检查点）大多数时间成功，偶现失败。目前针对超时类失败做了分析，存在部分特点，希望大佬们分析下原因。 > >（1）KafkaSouce的e2e时间达到1min+，正常xxx >ms就结束了。同时对应e2e达到1min+的情况下，sync、async、alignment、start delay等都为0，偶尔几个x >ms的。这个不是很明白什么情况会是这样呢？ >

回复：flink流、批场景下kafka拉取速率问题：每批次拉取多少条？是动态吗还是可以设置

2021-04-21 文章熊云昆

有个这个参数max.poll.records，表示一次最多获取多少条record数据，默认是500条 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2021年04月20日 18:19，李一飞写道： flink流、批场景下kafka拉取速率问题：每批次拉取多少条？是动态吗还是可以设置最好分流、批场景回答一下，谢谢！

回复：flink -conf.yaml修改

2021-04-12 文章熊云昆

重启job就可以了，不需要重启集群 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2021年04月12日 14:34，smq 写道：大家好，这个配置文件修改之后需要什么操作才生效吗，比如重启集群，还是说直接启动作业自动就应用了呢

回复：Flink checkpoint 速度慢问题请教

2021-02-27 文章熊云昆

你的checkpoint是用rocksdb还是filesystem？磁盘不同确实会影响checkpoint速度的 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2021年02月27日 14:14，Jacob 写道： Hi All, 生产环境有一个Job,在hadoopA集群运行稳定正常，checkpoint速度也很快（checkpoint间隔时间是30s,每一个checkpoint大小几十kb，做一次checkpoint耗时为毫秒级别）相同

回复：怎样定时更新广播变量的值

2020-12-08 文章熊云昆

最简单的方式就是自定义Source，里面定时检测配置文件是否有更新，如果有更新的话就发送配置文件的内容，下游算子把这个source发送的内容当做广播变量 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年12月08日 17:36，Lei Wang 写道： flink 程序读配置文件，配置文件的内容作为广播变量广播出去。如果配置文件更新了，怎样能把广播变量的内容也更新呢？谢谢，王磊

回复：flink使用RocksDB增量checkpoints，程序运行一段时间报出：超出物理内存

2020-12-07 文章熊云昆

是线程安全的，mapstate也是keyed state，同一个key的state肯定是同一个线程处理的 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年12月07日 18:18，bradyMk 写道：这面还想多请教一下：我程序中每来一条数据都会去读MapState然后覆盖写入新的时间戳，刚刚发现某一条数据读出了两条一样的时间戳，我推断是第一个线程读出来后还没等覆盖掉，第二个线程又读了一遍，导致出现两条一样的时间戳；所以想请问flink中MapState是线程安全的吗？ - Best

Re:修改topic名称后从Savepoint重启会怎么消费Kafka

2020-12-01 文章熊云昆

可以手动控制的，如果不设置默认是从最新位置开始消费，否则按照你的startup-mode来在 2020-12-01 20:59:48，"Shuai Xia" 写道： > >Hi，大佬们 >突然有一个疑问点，Flink消费kafka的Job保存了SP之后停止，修改代码中的topic名称之后重启。 >会从新topic的哪里开始消费？与startup-mode一致，还是从最新呢？ >可以手动控制么？

Re:Flink检查点失败，原因写着是job failed，但我的job明明好好的。

2020-11-30 文章熊云昆

job没有失败重启过吗？感觉是重启过吧在 2020-11-30 22:23:54，"赵一旦" 写道： >如题。 > >Checkpoint Detail: >Path: - Discarded: - Failure Message: The job has failed. > > >如上，请问一般啥情况呢这是。

回复：flink cep超时事件的问题

2020-10-30 文章熊云昆

session window可以满足你的需求的，你可以查一下 session window的例子 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月30日 13:07，sunfulin 写道： hi， session window能处理这种超时事件么？不知道有没有例子可以参考参考哈。在 2020-10-30 11:12:55，"naisili Yuan" 写道： > 不知道理解错没有，感觉你这个场景使用session windows能解决 &

回复：Flink mysqlCDC ,然后jdbc sink 到mysql 乱序问题

2020-10-23 文章熊云昆

你的数据有没有时间属性？可以用时间来判断吧 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月23日 14:21，air23 写道：你好，这边发现使用cdc读取mysql ，然后写入mysql会有乱序问题在上游mysql update一条数据，connert=print是有一条delete 和一条insert的数据，但是jdbc写入mysql时候发现mysql有时候是正常的，但是有时候会没有，当把并行度改成1的时候是正常的。这边怀疑是乱序了，先insert 再delete了。所以导致结果表没有这条数

回复：请问现在Flink支持动态扩缩容吗？

2020-10-19 文章熊云昆

目前还不支持吧 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月19日 18:22，林影写道：请问现在Flink支持动态扩缩容吗，或者说社区在这方面有什么计划吗？

Re: flink-windows-state

2020-10-13 文章熊云昆

你的state是用rocksdb存储的吗？ | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制 On 10/13/2020 18:20, 宁吉浩 wrote: hi，all 最近在使用flink遇到了问题，问题描述如下: checkpoint失败，jm报tm心跳丢失，然后重新开启tm，不一会yarn上就先后开启了多个tm。数据量并不大，给的内存也足够，tm的内存都被沾满了，不管给多少运行到一定时间就会满，就会出现上述情况。正好跑了很多程序，有带windows 也有不带的，在这里发现了端倪，带windows的程序

回复：如何为每个flink任务分别设置metrics的reporter

2020-10-12 文章熊云昆

每个job启动时候单独读取配置就可以了吧 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月12日 18:17，xiao cai 写道： Hi：已知的设置metrics reporter的方式是在conf/flink-conf.yaml中，如果想要为每个任务分别设置不同的metrics reporter或者设置不同的参数，比如设置prometheus pushgateway的多个自定义的k=v，该如何设置呢？ Best xiao.

回复：rocksdb增量ckeckpoint问题

2020-10-10 文章熊云昆

谢谢，大概明白了 | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月10日 16:42，Yun Tang 写道： Hi，云昆首先，如果Congxian回答的，sst文件是不变的，所以就有了“增量”的前提，如果多个checkpoint均包含某个sst文件，那么该文件可以在多个checkpoint间共享，这些文件表示是属于shared的文件，存储在shared目录下，可以参考文档[1]。这并不与保留一个checkpoint不一致，增量checkpoint的含义是上传的数据是增量的，但是每一个

回复：rocksdb增量ckeckpoint问题

2020-10-10 文章熊云昆

原来的sst文件存在原来的chk-***下面，意味着原来的chk-***不会被删除，这与stat.checkpoints.num-retained保留1个checkpoint不一致吧？ | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制在2020年10月09日 10:47，Congxian Qiu 写道： Hi 增量 checkpoint 是指，每次只上传的 *必须的* sst 文件。因为 RocksDB 生成的 sst 文件是不可变的，所以之前上传过的 sst 文件直接引用即可，这样减少了很多 sst 文件的上传（也减少

rocksdb增量ckeckpoint问题

2020-10-06 文章熊云昆

Hi, 有个rocksdb增量checkpoint的问题不明白，如果state.checkpoints.num-retained默认设置为1，意味着checkpoint默认只保留1个，那么在增量checkpoint的时候，它是无法引用上一个checkpoint的备份的sst文件的，其实还是相当于全量备份了，对不对？ | | 熊云昆 | | 邮箱：xiongyun...@163.com | 签名由网易邮箱大师定制

Re:Re: 关于TableAPI的filesystem中compact功能

Re:KafkaSource检查点的end to end duration较长（1min）原因

回复：flink流、批场景下kafka拉取速率问题：每批次拉取多少条？是动态吗还是可以设置

回复：flink -conf.yaml修改

回复：Flink checkpoint 速度慢问题请教

回复：怎样定时更新广播变量的值

回复：flink使用RocksDB增量checkpoints，程序运行一段时间报出：超出物理内存

Re:修改topic名称后从Savepoint重启会怎么消费Kafka

Re:Flink检查点失败，原因写着是job failed，但我的job明明好好的。

回复：flink cep超时事件的问题

回复：Flink mysqlCDC ,然后jdbc sink 到mysql 乱序问题

回复：请问现在Flink支持动态扩缩容吗？

Re: flink-windows-state

回复：如何为每个flink任务分别设置metrics的reporter

回复：rocksdb增量ckeckpoint问题

回复：rocksdb增量ckeckpoint问题

rocksdb增量ckeckpoint问题

17 matches

Site Navigation

Mail list logo

Footer information