date:20201130

Re: 分组查询时，select的字段是否一定要都在group by中吗？

2020-11-30 文章 Leonard Xu

Hi, bulterman 你的分析是对的，group by pk的query是可以优化到筛选全部列的，这可以是个优化点，只是flink 现在还没有做，和 Flink pk的 NOT ENFORCED 并没有关系，NOT NEOFRCED是说Flink不持有数据，不像数据库持有数据可以在读取时做校验。个人感觉这是个小的优化点，如果很急需可以考虑在社区开个issue. 祝好， Leonard Xu > 在 2020年12月1日，13:40，bulterman <15618338...@163.com> 写道： > > Hi ALL, >我用Flink SQL

Re:Re: flink sql cdc sum 结果出现NULL

2020-11-30 文章 kandy.wang

@Jianzhi Zhang 嗯，是这个原因，感谢回复。就是decimal的精度问题在 2020-12-01 13:24:23，"Jianzhi Zhang" 写道： >是不是你的decimal字段长度太短了，计算结果超出了精度范围导致null的出现 > >> 2020年11月19日下午10:41，kandy.wang 写道： >> >> --mysql表 >> CREATE TABLE IF NOT EXISTS `mysql_realtime_leaving_price_spu_index_agg`( >> `id` INT

Re: 关于flink cdc sql转出Stream流问题

2020-11-30 文章 jsqf

可以使用这种方式: DataStream dstream = tableEnv.toAppendStream(sourceTable, RowData.class); -- Sent from: http://apache-flink.147419.n8.nabble.com/

分组查询时，select的字段是否一定要都在group by中吗？

2020-11-30 文章 bulterman

Hi ALL, 我用Flink SQL 建了一张表，主键也设置了，执行形如"select * from test_table group by 主键 " 会报Expression 'XXX' is not being group的错误，通常来说按主键group by的话不是可以确定唯一性的吗？难道是因为建表语句中flink的主键约束模式只支持 NOT ENFROCED吗？这里有点不太明白

Re: flink sql cdc sum 结果出现NULL

2020-11-30 文章 Jianzhi Zhang

是不是你的decimal字段长度太短了，计算结果超出了精度范围导致null的出现 > 2020年11月19日下午10:41，kandy.wang 写道： > > --mysql表 > CREATE TABLE IF NOT EXISTS `mysql_realtime_leaving_price_spu_index_agg`( > `id` INT UNSIGNED AUTO_INCREMENT, > `spu_id` BIGINT NOT NULL, > `leaving_price` DECIMAL(10, 5) > PRIMARY KEY ( `id` ),

使用flink-sql解析debezium采集的mysql timestamp字段报错

2020-11-30 文章王羽凡

flink-sql-client执行建表： CREATE TABLE source_xxx ( id INT, ctime TIMESTAMP ) WITH ( 'connector' = 'kafka', 'topic' = 'xxx', 'properties.bootstrap.servers' = 'localhost:9092', 'format' = 'debezium-json', 'scan.startup.mode' = 'earliest-offset', 'debezium-json.schema-include' = 'false',

Re: 使用 StreamingFileSink后 checkpoint状态中的数据如何hive读取

2020-11-30 文章 admin

hi，你需要使用oncheckpoint的policy，这样在每次Checkpoint时会滚动文件 > 2020年11月30日下午4:57，liliang <904716...@qq.com> 写道： > > 本人使用的StreamingFileSink将数据按照行保存到hdfs中 > StreamingFileSink streamingFileSink = StreamingFileSink. >forRowFormat(new Path(path), new > SimpleStringEncoder("UTF-8")) >

Re: 退订

2020-11-30 文章 Xingbo Huang

Hi, 退订请发邮件到 user-zh-unsubscr...@flink.apache.org 详细的可以参考 [1] [1] https://flink.apache.org/zh/community.html#section-1 Best, Xingb elvis 于2020年12月1日周二上午9:42写道： > 退订

Re: Flink检查点失败，原因写着是job failed，但我的job明明好好的。

2020-11-30 文章赵一旦

并没有，restored为0。熊云昆于2020年12月1日周二上午8:44写道： > job没有失败重启过吗？感觉是重启过吧 > > > > > > > > > > > > > > > > > > 在 2020-11-30 22:23:54，"赵一旦" 写道： > >如题。 > > > >Checkpoint Detail: > >Path: - Discarded: - Failure Message: The job has failed. > > > > > >如上，请问一般啥情况呢这是。 >

Re: flink sql es写入时，用户名密码认证不支持

2020-11-30 文章 zhisheng

不需要，设置用户名和密码就行 Best zhisheng HunterXHunter <1356469...@qq.com> 于2020年12月1日周二上午9:46写道： > 你说的是es的 xpack 认证吗，需要你载入certificate文件是吗 > > > > -- > Sent from: http://apache-flink.147419.n8.nabble.com/ >

????

2020-11-30 文章 elvis

Re: flink-1.11.2 job启动不起来，

2020-11-30 文章 zhisheng

hi，正超建议把作业的日志发一下？ Best zhisheng 神奇哥哥 <759341...@qq.com> 于2020年12月1日周二上午9:38写道： > 你好，此问题我也遇到。目前已解决。 > 解决办法: > 查看你pom文件中是否引入了hadoop相关依赖，Flink 1.11需要把hadoop相关依赖注释掉。 > > > > -- > Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink sql es写入时，用户名密码认证不支持

2020-11-30 文章 HunterXHunter

你说的是es的 xpack 认证吗，需要你载入certificate文件是吗 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink sql es写入时，用户名密码认证不支持

2020-11-30 文章 zhisheng

1.12 支持了，参考 https://ci.apache.org/projects/flink/flink-docs-master/dev/table/connectors/elasticsearch.html#username Kyle Zhang 于2020年12月1日周二上午9:35写道： > Hi,你说的是这个问题么 > > https://issues.apache.org/jira/browse/FLINK-16788 > > On Mon, Nov 30, 2020 at 7:23 PM cljb...@163.com wrote: > > >

Re: flink-1.11.2 job启动不起来，

2020-11-30 文章神奇哥哥

注意是不是hadoop-client包冲突，hbase-server中也依赖了此包，需要排除。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink-1.11.2提交到yarn一直处于CREATED中

2020-11-30 文章神奇哥哥

注意是不是hadoop-client包冲突，hbase-server中也依赖了此包，需要排除。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink-1.11.2提交到yarn一直处于CREATED中

2020-11-30 文章神奇哥哥

你好，此问题我也遇到。目前已解决。解决办法: 查看你pom文件中是否引入了hadoop相关依赖，Flink 1.11需要把hadoop相关依赖注释掉。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink-1.11.2 job启动不起来，

2020-11-30 文章神奇哥哥

你好，此问题我也遇到。目前已解决。解决办法: 查看你pom文件中是否引入了hadoop相关依赖，Flink 1.11需要把hadoop相关依赖注释掉。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

flink sql client 报错java.net.NoRouteToHostException: 没有到主机的路由

2020-11-30 文章奚焘

本人刚学习flink ，下载解压了flink，启动./sql-client.sh embedded ，输入SELECT 'Hello World';报错 Flink SQL> SELECT 'Hello World'; [ERROR] Could not execute SQL statement. Reason: java.net.NoRouteToHostException: 没有到主机的路由 -- Sent from: http://apache-flink.147419.n8.nabble.com/

摄像头视频流采集

2020-11-30 文章 Xia(Nate) Qu

请教各位：我们想做多个监控摄像头的视频流采集平台，摄像头的数量大概有1000-5000个，摄像头的流数据直接发到采集平台，之后平台可以将数据写到Hadoop或者用于机器学习消费，不知道flink是不是适合这样的场景呢？谢谢屈夏

Re: flink sql es写入时，用户名密码认证不支持

2020-11-30 文章 Kyle Zhang

Hi,你说的是这个问题么 https://issues.apache.org/jira/browse/FLINK-16788 On Mon, Nov 30, 2020 at 7:23 PM cljb...@163.com wrote: > 看了一下官网文档，目前还不支持sql 写入es时进行用户名密码认证，有什么比较简单的解决方法吗？ > 除了用api之外。 > > 感谢！ > > > > cljb...@163.com >

Re:Flink检查点失败，原因写着是job failed，但我的job明明好好的。

2020-11-30 文章熊云昆

job没有失败重启过吗？感觉是重启过吧在 2020-11-30 22:23:54，"赵一旦" 写道： >如题。 > >Checkpoint Detail: >Path: - Discarded: - Failure Message: The job has failed. > > >如上，请问一般啥情况呢这是。

flink cdc 如何保证group agg结果正确性

2020-11-30 文章 kandy.wang

insert into kudu.default_database.index_agg SELECT v_spu_id as spu_id,sum(leaving_num*vipshop_price) as leaving_price,DATE_FORMAT(LOCALTIMESTAMP,'-MM-dd HH:mm:ss') FROM XX.XX.XX group by v_spu_id; XX.XX.XX 是通过自定义cdc format消费公司的cdc数据源，cdc数据源在kafka，数据只保留7天数据，都是增量消费，如何保证结果准确。

flink cdc 如何保证group agg结果正确性

2020-11-30 文章 kandy.wang

insert into kudu.default_database.index_agg SELECT v_spu_id as spu_id,sum(leaving_num*vipshop_price) as leaving_price,DATE_FORMAT(LOCALTIMESTAMP,'-MM-dd HH:mm:ss') FROM XX.XX.XX group by v_spu_id; XX.XX.XX 是通过自定义cdc format消费公司的cdc数据源，cdc数据源在kafka，数据只保留7天数据，都是增量消费，如何保证结果准确。

Re: flink任务运行不久后报netty错误

2020-11-30 文章赵一旦

希望有人回答下这个问题，比较奇怪，也不是很好排查原因。赵一旦于2020年11月27日周五下午9:25写道： > 如下报错： > 19:59:56.128 [Flink Netty Client (8009) Thread 6] WARN > org.apache.flink.shaded.netty4.io.netty.channel.epoll.EpollEventLoop - > Unexpected exce > ption in the selector loop. >

flink taskmanager netty报错。

2020-11-30 文章赵一旦

如下图，报错报的是关于selector loop中错误。希望有大神帮忙分析下可能原因。 22:23:17.045 [Flink Netty Client (2007) Thread 28] WARN org.apache.flink.shaded.netty4.io.netty.channel.epoll.EpollEventLoop - Unexpected exception in the selector loop. org.apache.flink.shaded.netty4.io.netty.channel.unix.Errors$NativeIoException:

Flink检查点失败，原因写着是job failed，但我的job明明好好的。

2020-11-30 文章赵一旦

如题。 Checkpoint Detail: Path: - Discarded: - Failure Message: The job has failed. 如上，请问一般啥情况呢这是。

flink sql es写入时，用户名密码认证不支持

2020-11-30 文章 cljb...@163.com

看了一下官网文档，目前还不支持sql 写入es时进行用户名密码认证，有什么比较简单的解决方法吗？除了用api之外。感谢！ cljb...@163.com

Re: Re: Re:回复：带有状态的算子保存checkpoint失败

2020-11-30 文章 Congxian Qiu

checkpoint 失败了可以看看是超时了，还是有 task snapshot 失败了，可以从 JM log 中来发现。超时的话，可以看下是数据量大需要时间久，还是 timeout 啥的设置太短；异常的话可以从对应的 tm log 看下为啥 snapshot 失败了 Best, Congxian 王默于2020年11月27日周五下午11:43写道： > checkpoint失败是在web页面上发现的，您看下截图https://imgchr.com/i/Dr3PNn > 看taskmanager日志确实没有超时，也没有其他异常 > > > > > > > > > > > >

flink sql cdc做计算后， elastic search connector 多并发sink 会有问题，偶现！数据量较大，目前还没较好复现。请问有人是否也遇到过类似的问题。

2020-11-30 文章 jindy_liu

flink 版本： 1.11.2 * Caused by: [rt_caliber_1000/Rn_SXw45Qk2FY8ujAMpmmQ][[rt_caliber_1000][1]] ElasticsearchException[Elasticsearch exception [type=version_conflict_engine_exception, reason=[64_40108_0_1]: version conflict, required seqNo [95958], primary term [1]. current document has seqNo

Re: 请教一下目前flink submit能不能指定额外的依赖jar

2020-11-30 文章 zilong xiao

原来如此，我觉得是一个不错的想法，但是其实对用户来说，最好除了写SQL之外，其他事情都不要做是最好

Re: 请教一下目前flink submit能不能指定额外的依赖jar

2020-11-30 文章 silence

你好：这个原因最开始已经说明了，main jar就是将传入的sql参数进行解析封装，而sql里用到的udf、connector之类的类型希望可以做到动态指定一方面可以做到灵活的依赖控制，减少main jar的大小另一方吧可以减少不同connector和udf，或不同版本connector和udf的依赖冲突的可能性 ps：假如平台有数十种connector和数百个udf都打到一个fast jar里想想都觉得不太优雅吧 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 请教一下目前flink submit能不能指定额外的依赖jar

2020-11-30 文章 zilong xiao

Hi silence, 想问下为什么一定要submit参数呢？我理解如果是做平台的话，用户如果有多个jar依赖，为什么不把这些jar统一打包到任务主jar里呢？，平台可以提供一些公共依赖，比如flink，hadoop等 silence 于2020年11月30日周一下午5:20写道： > 看了很多同学回复yarn的解决方案 > > 我这再补充一下： > 还是希望可以提供更通用的submit参数来解决此问题， > 包括提交到standalone集群时可以额外指定本地依赖jar > > 有没有cli相关的同学可以跟进下建议 > 谢谢 > > > > -- > Sent from:

Re: 请教一下目前flink submit能不能指定额外的依赖jar

2020-11-30 文章 silence

看了很多同学回复yarn的解决方案我这再补充一下：还是希望可以提供更通用的submit参数来解决此问题，包括提交到standalone集群时可以额外指定本地依赖jar 有没有cli相关的同学可以跟进下建议谢谢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: FlinkSQL导致Prometheus内存暴涨

2020-11-30 文章 Luna Wong

我看了源码了。operator name截断了。但是task name没截断。task name是那些operator name拼起来的所以特别长。现在我只是魔改源码临时截断了一下，咱还是在issue里讨论吧 Jark Wu 于2020年11月26日周四下午8:53写道： > > IIRC, runtime will truncate the operator name to max 80 characters, see > `TaskMetricGroup#METRICS_OPERATOR_NAME_MAX_LENGTH`. > You can search the log if

使用 StreamingFileSink后 checkpoint状态中的数据如何hive读取

2020-11-30 文章 liliang

本人使用的StreamingFileSink将数据按照行保存到hdfs中 StreamingFileSink streamingFileSink = StreamingFileSink. forRowFormat(new Path(path), new SimpleStringEncoder("UTF-8")) .withBucketAssigner(bucketAssigner) .withRollingPolicy(

关于flink cdc sql转出Stream流问题

2020-11-30 文章 yujianbo

代码采用sql方式接入mysql cdc数据然后转出Stream流，写入kudu，但是不知道怎么去获取 row里面的主键字段是哪一个和字段名称和类型等？或者toRetractStream可以指定其他的class？？？下面是代码 == tableEnv.executeSql(createTableSql); Table table = tableEnv.sqlQuery(querySql); DataStream> dataStream =

Re: flink on native k8s deploy issue

2020-11-30 文章 Yang Wang

如果你是用的ClusterIP的暴露方式，那任务提交只能在K8s内进行的因为外部环境无法解析到K8s内部的service(也就是tuiwen-flink-rest.flink) 你可以在K8s集群内起一个Pod来充当Flink client，然后在Pod内进行任务提交 Best, Yang 吴松于2020年11月24日周二下午4:23写道： > 不好意思，这个报错应该是内存的问题。我想说的是一下的报错。 > > > > > > > 2020-11-24 16:19:33,569 ERROR >

Re: flink-json 函数用法

2020-11-30 文章 Yan,Yunpeng(DXM,PB)

Hi：那我再看看json相关的信息，然后刚才测试的时候发现这个另一个问题 select ENCODE('ISO-8859-1', F_sp_withdraw_user_name) from t_sp_user_info where F_sp_withdraw_user_name is not null; Exception in thread "main" org.apache.flink.table.client.SqlClientException: Unexpected exception. This is a bug. Please

39 matches

Mail list logo