传统上 SQL 都会要求 select group 中 select 的列要么是统计列,要么是 group by 
,列是定义结果集的,不是直接对应表字段(想一下如果 from 自一个结果集)。以前 MySQL 可以 group by pk only ,后来高版本也改掉了。

________________________________
From: Leonard Xu <xbjt...@gmail.com>
Sent: Tuesday, December 1, 2020 6:34 AM
To: user-zh <user-zh@flink.apache.org>
Subject: Re: 分组查询时,select的字段是否一定要都在group by中吗?

Hi, bulterman

你的分析是对的,group by pk的query是可以优化到筛选全部列的,这可以是个优化点,只是flink 现在还没有做, 和 Flink pk的 NOT 
ENFORCED 并没有关系,NOT NEOFRCED是说Flink不持有数据,不像数据库持有数据可以在读取时做校验。 
个人感觉这是个小的优化点,如果很急需可以考虑在社区开个issue.


祝好,
Leonard Xu


> 在 2020年12月1日,13:40,bulterman <15618338...@163.com> 写道:
>
> Hi ALL,
>    我用Flink SQL 建了一张表,主键也设置了,执行形如"select * from test_table group by 主键 " 
> 会报Expression 'XXX' is not being group的错误,通常来说按主键group by的话不是可以确定唯一性的吗? 
> 难道是因为建表语句中flink的主键约束模式只支持 NOT ENFROCED吗?  这里有点不太明白

回复