[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16701316#comment-16701316 ] yangwei commented on KYLIN-3696: 好的感谢,这么快就把原因找出。 > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16699807#comment-16699807 ] yangwei commented on KYLIN-3696: 看了3693,有一点不一样的是,topN我用spark 构建时如上图cube1所示选择的维度较少时,结果是正确的 如果 选择的维度比较多时如上图cube2所示需要用mr构建才正确。 > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16696445#comment-16696445 ] yangwei commented on KYLIN-3696: mr engine 没有问题已验证 > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692608#comment-16692608 ] yangwei commented on KYLIN-3696: 好的我用mr engine > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Comment Edited] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692608#comment-16692608 ] yangwei edited comment on KYLIN-3696 at 11/20/18 3:48 AM: -- 好的我用mr engine试下 was (Author: yangwei): 好的我用mr engine > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692597#comment-16692597 ] yangwei commented on KYLIN-3696: !image-2018-11-20-11-27-43-750.png! > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Updated] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel ] yangwei updated KYLIN-3696: --- Attachment: image-2018-11-20-11-27-43-750.png > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
[ https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692594#comment-16692594 ] yangwei commented on KYLIN-3696: spark > TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 > > > Key: KYLIN-3696 > URL: https://issues.apache.org/jira/browse/KYLIN-3696 > Project: Kylin > Issue Type: Bug > Components: Measure - TopN >Affects Versions: v2.5.1 >Reporter: yangwei >Priority: Major > Attachments: image-2018-11-20-10-57-28-546.png, > image-2018-11-20-11-01-25-120.png > > > 我使用的是v2.5.1,度量topN使用上出现不准的总量。 > 问题再现: > 一,二个cube使用同一个模型就是同一张物理事实表。 > 二,二个cube同时包含相同的topN度量 > 三,二个cube状态都是Ready > 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 > 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql > SELECT IP , > SUM(ACCESS_COUNT) c > FROM API_ACCESS > WHERE TAG_DATE = CAST('2018-11-19' AS DATE) > group by ip > ORDER BY > c DESC > LIMIT 10; > 二个cube中的度量: > cube1: > !image-2018-11-20-10-57-28-546.png! > cube2: > !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)
[jira] [Created] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
yangwei created KYLIN-3696: -- Summary: TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多 Key: KYLIN-3696 URL: https://issues.apache.org/jira/browse/KYLIN-3696 Project: Kylin Issue Type: Bug Components: Measure - TopN Affects Versions: v2.5.1 Reporter: yangwei Attachments: image-2018-11-20-10-57-28-546.png, image-2018-11-20-11-01-25-120.png 我使用的是v2.5.1,度量topN使用上出现不准的总量。 问题再现: 一,二个cube使用同一个模型就是同一张物理事实表。 二,二个cube同时包含相同的topN度量 三,二个cube状态都是Ready 目前我暂时的解决方法是在其中一个cube去掉一个topN度量 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql SELECT IP , SUM(ACCESS_COUNT) c FROM API_ACCESS WHERE TAG_DATE = CAST('2018-11-19' AS DATE) group by ip ORDER BY c DESC LIMIT 10; 二个cube中的度量: cube1: !image-2018-11-20-10-57-28-546.png! cube2: !image-2018-11-20-11-01-25-120.png! -- This message was sent by Atlassian JIRA (v7.6.3#76005)