subject:"回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据"

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread 972684638

修改grafana模板的查询语句，在promeQL后面加上[1m，1s]，这样过期太久的数据，就不会查到了 ---原始邮件--- 发件人: "bradyMk"http://apache-flink.147419.n8.nabble.com/

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread 972684638

flink_jobmanager_job_uptime[1m:1s] ，意思是在过去一分钟的时间段内，每秒查询一次flink_jobmanager_job_uptime这个指标，查出来是一个列表，如果过去一分钟都没数据，则列表为空。你可以尝试flink_jobmanager_job_uptime[1m:1s]这个写法，有没有效果我没试过 ---原始邮件--- 发件人: "bradyMk"http://apache-flink.147419.n8.nabble.com/

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread 972684638

flink_jobmanager_job_uptime[1m:1s] ，意思是在过去一分钟的时间段内，每秒查询一次flink_jobmanager_job_uptime这个指标，查出来是一个列表，如果过去一分钟都没数据，则列表为空。你可以尝试flink_jobmanager_job_uptime[1s:1s]这个写法，有没有效果我没试过 ---原始邮件--- 发件人: "bradyMk"http://apache-flink.147419.n8.nabble.com/

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread 972684638

所以，你的根本问题，其实是如何让同一个flink任务的两次运行实例，查出不一样的metrics，而不是拿着任务名，去查出所有实例的metrics，我的理解对吗？ ---原始邮件--- 发件人: "bradyMk"http://apache-flink.147419.n8.nabble.com/

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread 972684638

那是否可以在kill或者cancel的时候，利用脚本触发一次清理 ---原始邮件--- 发件人: "Yaoting Gong"http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，我不是很懂您的意思，例如我这边有一个这样的指标：flink_jobmanager_job_uptime 监控一个任务的运行时长；如果该任务被kill掉，那么这个指标的数值会变成一个不变的量，一直显示在grafana中。我不太会promeQL，我尝试这样： flink_jobmanager_job_uptime[1m]，这样是个非法查询命令，按照您的意思，应该怎么改呢？ - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，我不是很懂您的意思，例如我这边有一个这样的指标：flink_jobmanager_job_uptime 监控一个任务的运行时长；如果该任务被kill掉，那么这个指标的数值会变成一个不变的量，一直显示在grafana中。我不太会promeQL，我尝试这样： flink_jobmanager_job_uptime[1m]，这样是个非法查询命令，按照您的意思，应该怎么改呢？ - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread xiao cai

Hi: 可以试试在flink-conf.yaml中添加： metrics.reporter.promgateway.deleteOnShutdown: true Best, Xiao 原始邮件发件人: bradyMk 收件人: user-zh 发送时间: 2020年9月1日(周二) 16:50 主题: Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据您好，我不是很懂您的意思，例如我这边有一个这样的指标：flink_jobmanager_job_uptime 监控一个任务的运行时长

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，这个指标我已经设置了，但是这个指标只是针对cancel或者stop某个作业时生效，但是用kill的方式，是删除不掉Pushgateway内残留的数据的 - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，我采用了您说的这种方式，但是会报这样的错误： "invalid expression type \"range vector\" for range query, must be Scalar or instant Vector" - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，我已经设置了该参数，但是该参数是针对对cancel或者stop的作业有效，但是对kill掉的作业是不会删除掉Pushgateway中残留的指标数据的 - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，您说的这种方法貌似行不通，因为指标数据是没有被删除的，所以不会出现没数据的情况，按您这么查询，查出的列表将会一直有数据的，只是数据会一直不变 - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

目前我能想到的就是这个办法，但感觉有点曲线救国的意思，不知道还有没有更直接一点的方法 - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread Yaoting Gong

清理gateway里面的数据，通过他的接口就行。 Prometheus 已经采集的历史数据肯定不能请离开，有问题才需要定位。我们是直接定时清理，运行周期和指标采集周期有一定关系，避免数据丢失。如果对flink 进行封装，比如我们后期开发计算平台，是可以通过统一入口做封装，关闭、停止任务时精准清理，不过暂时还没有做 bradyMk 于2020年9月1日周二下午5:41写道： > 目前我能想到的就是这个办法，但感觉有点曲线救国的意思，不知道还有没有更直接一点的方法 > > > > - > Best Wishes > -- > Sent from: http://apache-

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread Yaoting Gong

“ Prometheus 已经采集的历史数据肯定不能清理，有问题还需要用这些数据定位问题。 ” Yaoting Gong 于2020年9月1日周二下午6:24写道： > 清理gateway里面的数据，通过他的接口就行。 Prometheus 已经采集的历史数据肯定不能请离开，有问题才需要定位。 > > 我们是直接定时清理，运行周期和指标采集周期有一定关系，避免数据丢失。如果对flink > 进行封装，比如我们后期开发计算平台，是可以通过统一入口做封装，关闭、停止任务时精准清理，不过暂时还没有做 > > bradyMk 于2020年9月1日周二下午5:41写道： > >> 目前

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread shizk233

t; Xiao > 原始邮件 > 发件人: bradyMk > 收件人: user-zh > 发送时间: 2020年9月1日(周二) 16:50 > 主题: Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据 > > > 您好，我不是很懂您的意思，例如我这边有一个这样的指标：flink_jobmanager_job_uptime 监控一个任务的运行时长； > 如果该任务被kill掉，那么这个指标的数值会变成一个不变的量，一直显示在grafana中。我不太

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread xiao cai

Hi shizk233：我这边也复现了你说的情况，一模一样。可以尝试使用定时调度任务检查flink任务的执行情况，当不再处于运行状态时，主动调用pushgateway的delete方法来删除pushgetway的metrics。原始邮件发件人: shizk233 收件人: user-zh@flink.apache.org 发送时间: 2020年9月1日(周二) 19:10 主题: Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据 Hi Xiao, 我这边实践

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，我之前也想到了这个方法，但是Pushgateway中的metrics因为设置了randomJobNameSuffix：true参数，导致Pushgateway中的job名称都是随机生成的，例如这样：他的名字是随机的，我该怎么用delete方法删除呢？ - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread Jim Chen

收件人: user-zh@flink.apache.org > 发送时间: 2020年9月1日(周二) 19:10 > 主题: Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据 > > > Hi Xiao, 我这边实践过程中发现，该参数只能删除jobmanager对应的metrics group，不能删除tm的。 > 我们开启了randomJobNameSuffix，该参数会让JM和TM的metrics信息分属不同metrics group。 > 感觉这可能是一个b

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 Thread bradyMk

您好，可以请教一下如何清理Pushgateway中的数据么？我是想主动调用pushgateway的delete方法来删除pushgetway的metrics，但是Pushgateway中的metrics因为设置了randomJobNameSuffix：true参数，导致Pushgateway中的job名称都是随机生成的，那么该如何清理呢？ - Best Wishes -- Sent from: http://apache-flink.147419.n

Re:Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-02 Thread chenkaibit

eSuffix，该参数会让JM和TM的metrics信息分属不同metrics group。 >> 感觉这可能是一个bug? xiao cai 于2020年9月1日周二下午4:57写道： > Hi: > >> 可以试试在flink-conf.yaml中添加： > metrics.reporter.promgateway.deleteOnShutdown: >> true > > > Best, > Xiao > 原始邮件 > 发件人: bradyMk > 收件人: >> user-zh > 发送时间: 2020年9月1日(周二) 16:50 > 主

Re: Re:Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-03 Thread bradyMk

好的，谢谢您，我看一下~ - Best Wishes -- Sent from: http://apache-flink.147419.n8.nabble.com/

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re:Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

Re: Re:Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

22 matches

Site Navigation

Mail list logo

Footer information