您好:
Hash值是否会出现重复呢?

谢谢!

发件人: Weatherpop [mailto:623891...@qq.com]
发送时间: 2016年6月21日 15:11
收件人: u...@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的

------------------ 原始邮件 ------------------
发件人: "仇同心";<qiutong...@jd.com<mailto:qiutong...@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: 
"u...@kylin.apache.org<mailto:u...@kylin.apache.org>"<u...@kylin.apache.org<mailto:u...@kylin.apache.org>>;
 
"dev@kylin.apache.org<mailto:dev@kylin.apache.org>"<dev@kylin.apache.org<mailto:dev@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题

大家好:
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?

谢谢!

Reply via email to