date:20201230

Flink 1.12 Sql设置job name

2020-12-30 文章 HideOnBushKi

Hi 大佬们: 请教两个问题 tEnv.executeSql("sql1") tEnv.executeSql("sql2") 1.executeSql中，两个作业似乎被分配到了不同的yarn appId中运行，如果这两个作业共同依赖一个kakfa table，这会影响到消费位置吗？还是说这两个appID其实是一个作业 2.怎么在1.12 SQL中设置 job name呢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Flink 1.12 Sql设置job name

2020-12-30 文章 HideOnBushKi

Hi 大佬们: 请问怎么在1.12Flink sql 中设置job name呢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: SQL Client并行度设置问题

2020-12-30 文章 Jark Wu

在 Batch 模式下： 1. Hive source 会去推断并发数，并发数由文件数决定。你也可以通过 table.exec.hive.infer-source-parallelism=false 来禁止并发推断，这时候就会用 job 并发。或者设置一个最大的推断并发数 table.exec.hive.infer-source-parallelism.max。[1] 2. 同上。 3. 这里跟 max-parallelism 应该没有关系，应该是你没有配置 max slot 的原因，source 申请的并发太多，而 yarn 一时半会儿没这么多资源，所以超时了。配上 slot

SQL Client并行度设置问题

2020-12-30 文章 jiangjiguang719

flink1.12版本，使用SQL Client提交任务，读hive表，对并行度有些疑问，以下是现象： flink-conf.yaml文件中的： taskmanager.numberOfTaskSlots: 1 有效 parallelism.default: 1无效，实际任务的并行度=hive表的文件且 <= 160 sql-client-defaults.yaml 文件中的： execution: parallelism: 10无效 max-parallelism: 16 当hive表的文件数大于此值时，报资源不足 Dep

Flink sql执行insert into 的一些问题

2020-12-30 文章 Jacob

Dear All， Flink SQL> insert into table1 select filed1,filed2,.filed10 from table2; 在flink sql 中执行类似上面的语句，在webui中看到很快就finished了，但数据并没有写进table1表中，查看log，也看不到什么报错。迷惑还有，在使用select count(*) 查询表数据时，有的表能查到结果，有的就不显示结果，也没有报错。实在不知道什么原因了。。。 - Thanks! Jacob -- Sent from: http://apache-flink.1

Re: 关于先基于process_time预聚合，再基于event_time聚合的问题。

2020-12-30 文章赵一旦

这个问题基本分析应该没啥问题，发出来给大家参考借鉴。赵一旦于2020年12月31日周四下午1:01写道： > 目的呢如题：先基于process_time预聚合，最后基于event_time聚合。 > > 预聚合使用10s窗口，最终聚合使用5min窗口，且使用10s的continuous trigger。 > > > 同时，为了避免2个5分钟窗口的数据在窗口临界位置时候，被10s的预聚合到一起（错误case），我在预聚合的时候使用的key中多加了个字段（time），time是格式化到5分钟的结尾时间的time。因此这个问题可以忽略。 > > 但是呢，目前发现一个更大的问题。最终窗口

关于先基于process_time预聚合，再基于event_time聚合的问题。

2020-12-30 文章赵一旦

目的呢如题：先基于process_time预聚合，最后基于event_time聚合。预聚合使用10s窗口，最终聚合使用5min窗口，且使用10s的continuous trigger。同时，为了避免2个5分钟窗口的数据在窗口临界位置时候，被10s的预聚合到一起（错误case），我在预聚合的时候使用的key中多加了个字段（time），time是格式化到5分钟的结尾时间的time。因此这个问题可以忽略。但是呢，目前发现一个更大的问题。最终窗口输出的key+time的pv存在变小的情况。刚开始很奇怪，想了很久。然后分析出一些问题。实际key+time1=2: 1000，变为key+t

Re: flink1.12错误OSError: Expected IPC message of type schema but got record batch

2020-12-30 文章咿咿呀呀

up -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink-cdc 无法读出binlog，程序也不报错

2020-12-30 文章 chenjb

老哥，抱歉，后面忘了看这里的消息了，我当时在本地用idea调试的，也没开webui，所以也没看TaskManager的日志，确实在idea里面是没报错就结束了。后面把字段类型按官网的严格对应起来就没这个问题了。多谢老哥回复 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink cdc connector：数据量较大时，snapshot阶段报错

2020-12-30 文章 chenjb

老哥，我碰到了一样的问题，有找到原因吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

flink-cdc 简单聚合后再次通过jdbc-connector sink到mysql，SnapshotReader出现报错

2020-12-30 文章 chenjb

老哥们好，麻烦帮忙看看，谢谢场景是： source是用cdc从mysql读取数据（大概400多万条），用sql写的一个简单group by场景，然后通过jdbc-connector写到mysql 配置了checkpoint(5min一次)提交到flink standalone集群上运行，发现运行不久后好像数据流就停了，大概只处理了几万条数据，但任务依然是运行状态运行过程中sink很慢（大概算了下每秒17条记录），导致source的反压很高插入taskmanager日志发现有如下报错 2020-12-30 14:31:38,723 INFO io.debezium.co

Re: flink如何使用oss作为checkpoint/savepoint/statebackend?

2020-12-30 文章 Yun Tang

Hi 其实社区文档 [1] 已经给了很详细的步骤： 1. 将flink-oss-fs-hadoop jar包放在plugins目录下 2. 配置oss的endpoint，id和secret 3. 在需要使用oss的地方，声明oss:// 开头的schema，例如state backend创建的时候 [1] https://ci.apache.org/projects/flink/flink-docs-stable/deployment/filesystems/oss.html 祝好唐云 From:

Re:Re: flink 1.12.0 kubernetes-session部署问题

2020-12-30 文章陈帅

我是在MacBook Pro上搭建了一套MiniKube，安装了VirtualBox。请问正确启动 Flink v1.11.3 on K8S 的步骤是怎样的？我实践的步骤是: minikube start cd /Users/admin/dev/flink-1.11.3 ./bin/kubernetes-session.sh 此时显示拉取的镜像名称是 flink:1.11.3-scala_2.12 ，而不是dockerhub仓库上flink官方给的 flink:1.11.3-scala_2.12-java8 于是我重新使用命令 ./bin/kubernetes-session.sh

Re: FlinkSQL是否支持设置窗口trigger实现continuious trigger呢

2020-12-30 文章 Sebastian Liu

table.exec.emit.early-fire.delay 是一个duration type的configuration，不写单位会apply失败 fan_future 于2020年12月30日周三下午4:00写道： > 这两个参数 > table.exec.emit.early-fire.enabled > table.exec.emit.early-fire.delay > 是怎么设置的？？ > > EnvironmentSettings build = > > EnvironmentSettings.newInstance().useBlinkPlanne

flink on yarn??????????????

2020-12-30 文章 ??????

?? bin/flink run -m yarn-cluster -yjm 1024 -ytm 1024 -c com.dwd.lunch.dwd_lunch.Dim_Cc_Media -ys 1 xjia_shuyun-6.0.jar nodemanager?? Deployment took more than 60 seconds. Please check i

Re: flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

2020-12-30 文章 Sebastian Liu

Hi Jianqiang, 看不到email中的截图。但从你的描述中看，似乎是shade jar的问题，Flink SQL client启动的时候会自动使用FLINK_HOME/bin/config.sh中的constructFlinkClassPath，并append到当前SQL client JVM的CC_CLASSPATH中。所以理论上不需要向Flink lib目录cp其他jar，当然如果有特殊依赖jar，还是需要保证在CLASSPATH中的，但使用“--jar”或者“--library”来传递这些似乎是更好的选择，这两个参数会把jar当做job的user jar随JobGrap

Re: 回撤流-窗口计算

2020-12-30 文章孙啸龙

非常感谢回复，疑问1:实时ETL中，涉及join的操作的很多，一join之后，聚合操作就只能用非窗口计算了吗,这样不是实时etl里基本不能用到窗口和interval join? 疑问2: Connector='upset-kafka’,读到的是回撤流，如果后面的操作不能使用到窗口和interval join,是不是在这种情况下 watermark用不到？ > 在 2020年12月30日，下午8:31，hailongwang <18868816...@163.com> 写道： > > 需要的 window size 大吗，可以使用 min-batch 的 no-window agg

flink如何使用oss作为checkpoint/savepoint/statebackend?

2020-12-30 文章陈帅

请问flink如何使用oss作为checkpoint/savepoint/statebackend? 需要依赖Hadoop并配置Hadoop on OSS吗？

flink读写阿里云oss问题

2020-12-30 文章陈帅

请问flink如何批/流读写阿里云oss? 我试着通过filesystem sql connector [1] 连接oss，按照官网配置oss endpoint, accessKey (id + secret) [2] 在flink-conf.yaml文件，程序仍然报找不到 fs.oss.endpoint，我已经将 flink-oss-fs-hadoop jar放进了 plugins/目录下面。想问一下读写oss是否一定要依赖于hadoop呢？官网有提及 Hadoop Aliyun module，不知道具体做法是什么？还请给个具体实操例子，谢谢！ [1] https://ci

Re:回撤流-窗口计算

2020-12-30 文章 hailongwang

需要的 window size 大吗，可以使用 min-batch 的 no-window agg 绕过？ Best, Hailong 在 2020-12-30 17:41:50，"孙啸龙" 写道： >Hi,大家好： > >版本：1.12.0 >方式：Flink sql >问题：双流join后是回撤流，不能窗口计算,这种应用场景是怎么处理的？

Re:Re:flink1.12 SQL Client 报错

2020-12-30 文章 jiangjiguang719

问题已经解决： 1、需要 flink-sql-connector-hive-2.3.6_2.11-1.12.0.jar 去掉flink-connector-hive_2.11-1.12.0.jar和hive-exec-2.3.4.jar 2、不光要重启SQL Client 还需要重启本地集群在 2020-12-30 18:32:29，"hailongwang" <18868816...@163.com> 写道： >你在启动之后才把 jar 包放进去的吗，重启下 SQL Client 试试？ > > > > >在 2020-12-30 15:26:59

回复：自定义Connector 报错

2020-12-30 文章 superainbower

接着补充一下，在git上Cloudera/kudu 的pom文件里发现 com.stumbleupon async ${async.version} org.slf4j slf4j-api Not shaded or inc

回复：自定义Connector 报错

2020-12-30 文章 superainbower

补充一下，在git上Cloudera/kudu 下的 org.apache.kudu.client.AsyncKuduClient这个类里面，确实看到 import com.stumbleupon.async.Callback 应该就是kudu需要引入的，很奇怪已经将整个client的jar 放到lib里面了，怎么还会缺少呢 | | superainbower | | superainbo...@163.com | 签名由网易邮箱大师定制在2020年12月30日 18:59，superainbower 写道： hi， 1.在kudu-client.jar里，按你的方式grep不到，本

Flink cep可以自动化定义或者从数据中学习生成吗？还是得自己一条一条地添加pattern？

2020-12-30 文章 Xiali Wang

Dear All，近期在学习flīnk CEP的用法。产生了一个疑问。规则引擎现在用的还多吗？大家的规则都是自己一条一条定义的吗？有没有像drool那样，可以自动化生成一些规则模版呢？ - Thanks! Xiali Wang -- Sent from: xialiwa...@gmail.com

回复：自定义Connector 报错

2020-12-30 文章 superainbower

hi， 1.在kudu-client.jar里，按你的方式grep不到，本地idea下启动只引入了这一个依赖，是可以运行，所以将这个kudu-client的依赖直接放到了lib下，难道还要引入其他依赖吗？ 2.你说的对，close是可判空一下在2020年12月30日 18:33，hailongwang 写道：这个应该是 `kudu-client.jar` 里面应该打进去的吧。可以看下 jar -tf kudu-client.jar | grep 'com.stumbleupon.async.Callback' ps: 你的 close 方法有 npe，应该是客户端还没构建出来，

回撤流-窗口计算

2020-12-30 文章孙啸龙

Hi,大家好：版本：1.12.0 方式：Flink sql 问题：双流join后是回撤流，不能窗口计算,这种应用场景是怎么处理的？

canal-json format优化问题

2020-12-30 文章 air23

在官方文档上看到 canal-json format 有如下两个key canal-json.database.include canal-json.table.include 这2个key 看源码是equals等于关系，而不是include包含关系，是否这2个字段可以配置正则表达式来包含配置的表来支持呢，如 "'canal-json.table.include' = 'test*',"+ 因为可能会用到分库分表的flink场景。谢谢

Re:自定义Connector 报错

2020-12-30 文章 hailongwang

这个应该是 `kudu-client.jar` 里面应该打进去的吧。可以看下 jar -tf kudu-client.jar | grep 'com.stumbleupon.async.Callback' ps: 你的 close 方法有 npe，应该是客户端还没构建出来，可以判空下。 Best, Hailong 在 2020-12-30 17:24:48，"superainbower" 写道： >HI，大家好： >我有一个应用场景，利用Flinksql读取Kafka数据写入Kudu，由于官方没有Kudu Connector，自定义了一个Kudu Sink >Connector，

Re:flink1.12 SQL Client 报错

2020-12-30 文章 hailongwang

你在启动之后才把 jar 包放进去的吗，重启下 SQL Client 试试？在 2020-12-30 15:26:59，"jiangjiguang719" 写道： >使用 SQL Client，进行hive查询时报错： >命名有了flink-connector-hive_2.11-1.12.0.jar，还是报java.lang.ClassNotFoundException: >org.apache.flink.connectors.hive.HiveSource >麻烦看一下 > > >报错信息： > >Flink SQL> select count(*) from zxw_t

自定义Connector 报错

2020-12-30 文章 superainbower

HI，大家好：我有一个应用场景，利用Flinksql读取Kafka数据写入Kudu，由于官方没有Kudu Connector，自定义了一个Kudu Sink Connector，在本地IDEA下测试可以正常跑通；可是将代码打包，并将kudu-client.jar的依赖包放置Flink的lib目录下之后，提交任务到集群报错如下： java.lang.NoClassDefFoundError: com/stumbleupon/async/Callback at org.apache.kudu.client.AsyncKuduClient$AsyncKuduClien

Flink catalog+hive问题

2020-12-30 文章 guaishushu1...@163.com

在用flink catalog+hive做元数据持久化的时候还存在几个问题 1. DDL的字段信息都在properties中导致字段无法增删改，只能重新建表； 2. 生成的表没有owner信息； 3. HMS的权限对于Flink + hive并没有作用，无权限也可以直接引用表； guaishushu1...@163.com 发件人： 19916726683 发送时间： 2020-12-24 13:59 收件人： user-zh 主题： Re: Flink catalog+hive问题可以参考下这个 https://hadoop.apache.org/docs/current/

RE: flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

2020-12-30 文章 Zeng, Jianqiang Zack

Best Regards! Have a good day! Zack Zeng Associate Manager, Business Analyst Boston Scientific China Information Services jianqiang.z...@bsci.com (+86)21-61417831 #763 Mengzi Road, Shanghai, China www.bostonscientific.com [bsc

flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

2020-12-30 文章 Zeng, Jianqiang Zack

使用官网的Flink 1.12.0安装，已经正常启动，JPS可看到相关进程，WEBUI也正常启用，配置连接Hive 3.1.2，并将相关的JAR包放入了flink下面的lib文件夹当中，但启动sql-client报错，搜索定位说是guava的问题，可是我guava的包是直接软链接到hive下面的guava包，和hadoop也是共用同一个包，是哪里配置还有问题吗？相关截图如下，谢谢！ JPS截图 [cid:image001.png@01D6DEC9.837DC9A0] WebUI截图 [cid:image005.png@01D6DECA.ACF07C50] Flink/Lib 截图 [

flink1.12 SQL Client 报错

2020-12-30 文章 jiangjiguang719

使用 SQL Client，进行hive查询时报错：命名有了flink-connector-hive_2.11-1.12.0.jar，还是报java.lang.ClassNotFoundException: org.apache.flink.connectors.hive.HiveSource 麻烦看一下报错信息： Flink SQL> select count(*) from zxw_test_1225_01; 2020-12-30 16:20:42,518 WARN org.apache.hadoop.hive.conf.HiveConf

Re: FlinkSQL是否支持设置窗口trigger实现continuious trigger呢

2020-12-30 文章 fan_future

这两个参数 table.exec.emit.early-fire.enabled table.exec.emit.early-fire.delay 是怎么设置的？？ EnvironmentSettings build = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build(); TableEnvironment tEnv = TableEnvironment.create(build); Configuration tableConfig

Flink 1.12 Sql设置job name

Flink 1.12 Sql设置job name

Re: SQL Client并行度设置问题

SQL Client并行度设置问题

Flink sql执行insert into 的一些问题

Re: 关于先基于process_time预聚合，再基于event_time聚合的问题。

关于先基于process_time预聚合，再基于event_time聚合的问题。

Re: flink1.12错误OSError: Expected IPC message of type schema but got record batch

Re: flink-cdc 无法读出binlog，程序也不报错

Re: Flink cdc connector：数据量较大时，snapshot阶段报错

flink-cdc 简单聚合后再次通过jdbc-connector sink到mysql，SnapshotReader出现报错

Re: flink如何使用oss作为checkpoint/savepoint/statebackend?

Re:Re: flink 1.12.0 kubernetes-session部署问题

Re: FlinkSQL是否支持设置窗口trigger实现continuious trigger呢

flink on yarn??????????????

Re: flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

Re: 回撤流-窗口计算

flink如何使用oss作为checkpoint/savepoint/statebackend?

flink读写阿里云oss问题

Re:回撤流-窗口计算

Re:Re:flink1.12 SQL Client 报错

回复：自定义Connector 报错

回复：自定义Connector 报错

Flink cep可以自动化定义或者从数据中学习生成吗？还是得自己一条一条地添加pattern？

回复：自定义Connector 报错

回撤流-窗口计算

canal-json format优化问题

Re:自定义Connector 报错

Re:flink1.12 SQL Client 报错

自定义Connector 报错

Flink catalog+hive问题

RE: flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

flink 1.12.0 + hive 3.1.2 报错 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

flink1.12 SQL Client 报错

Re: FlinkSQL是否支持设置窗口trigger实现continuious trigger呢

35 matches

Site Navigation

Mail list logo

Footer information