Re: 在子查询上使用row_number over返回的rn都是1

2019-08-27 文章 ddwcg
因为sink到hbase,使用一个column存了top5的list,sink前我要组合一下这个list

> 在 2019年8月28日,10:12,Jark Wu  写道:
> 
> 为什么还需要后面接 process operator 呢? Flink TopN 已经帮你维护好了 state,直接输出到一个 update sink 
> 中就可以了。
> 
> 
> Best,
> Jark
> 
>> 在 2019年8月28日,10:08,ddwcg <3149768...@qq.com> 写道:
>> 
>> process
> 



Re: 在子查询上使用row_number over返回的rn都是1

2019-08-27 文章 Jark Wu
为什么还需要后面接 process operator 呢? Flink TopN 已经帮你维护好了 state,直接输出到一个 update sink 
中就可以了。


Best,
Jark

> 在 2019年8月28日,10:08,ddwcg <3149768...@qq.com> 写道:
> 
> process



Re: 在子查询上使用row_number over返回的rn都是1

2019-08-27 文章 Jark Wu
Hi,

你使用的是 flink 1.9 blink planner 吧?

首先你的 topn query 没有问题。结果也没有问题。
因为你是根据 province 分组求 top5,也就是每个省份排名前5的 id。但是现在你的数据中,每个省份只有一个 id,所以大家的排名都是1。
如果你想求全局前5名的省份,那么row_number 那里不需要定义 partition by province。

Best,
Jark


> 在 2019年8月27日,15:16,ddwcg <3149768...@qq.com> 写道:
> 
> 6> (true,id001,上海,647.55,1)