[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-27 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16701316#comment-16701316
 ] 

yangwei commented on KYLIN-3696:


好的感谢,这么快就把原因找出。

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-26 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16699807#comment-16699807
 ] 

yangwei commented on KYLIN-3696:


看了3693,有一点不一样的是,topN我用spark 构建时如上图cube1所示选择的维度较少时,结果是正确的 如果 
选择的维度比较多时如上图cube2所示需要用mr构建才正确。

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-22 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16696445#comment-16696445
 ] 

yangwei commented on KYLIN-3696:


mr engine 没有问题已验证

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692608#comment-16692608
 ] 

yangwei commented on KYLIN-3696:


好的我用mr engine

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Comment Edited] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692608#comment-16692608
 ] 

yangwei edited comment on KYLIN-3696 at 11/20/18 3:48 AM:
--

好的我用mr engine试下


was (Author: yangwei):
好的我用mr engine

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692597#comment-16692597
 ] 

yangwei commented on KYLIN-3696:


!image-2018-11-20-11-27-43-750.png!

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Updated] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)


 [ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel
 ]

yangwei updated KYLIN-3696:
---
Attachment: image-2018-11-20-11-27-43-750.png

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png, image-2018-11-20-11-27-43-750.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Commented] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)


[ 
https://issues.apache.org/jira/browse/KYLIN-3696?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=16692594#comment-16692594
 ] 

yangwei commented on KYLIN-3696:


spark

> TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
> 
>
> Key: KYLIN-3696
> URL: https://issues.apache.org/jira/browse/KYLIN-3696
> Project: Kylin
>  Issue Type: Bug
>  Components: Measure - TopN
>Affects Versions: v2.5.1
>Reporter: yangwei
>Priority: Major
> Attachments: image-2018-11-20-10-57-28-546.png, 
> image-2018-11-20-11-01-25-120.png
>
>
> 我使用的是v2.5.1,度量topN使用上出现不准的总量。
> 问题再现:
> 一,二个cube使用同一个模型就是同一张物理事实表。
> 二,二个cube同时包含相同的topN度量
> 三,二个cube状态都是Ready
> 目前我暂时的解决方法是在其中一个cube去掉一个topN度量
> 同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql
> SELECT IP ,
>  SUM(ACCESS_COUNT) c
> FROM API_ACCESS
> WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
>  group by ip
> ORDER BY 
>  c DESC
> LIMIT 10;
> 二个cube中的度量:
>  cube1:
> !image-2018-11-20-10-57-28-546.png!
> cube2:
> !image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)


[jira] [Created] (KYLIN-3696) TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多

2018-11-19 Thread yangwei (JIRA)
yangwei created KYLIN-3696:
--

 Summary: TOPN度量在同一个模型下2个cube同时开启统计值不准与真实值差得较多
 Key: KYLIN-3696
 URL: https://issues.apache.org/jira/browse/KYLIN-3696
 Project: Kylin
  Issue Type: Bug
  Components: Measure - TopN
Affects Versions: v2.5.1
Reporter: yangwei
 Attachments: image-2018-11-20-10-57-28-546.png, 
image-2018-11-20-11-01-25-120.png

我使用的是v2.5.1,度量topN使用上出现不准的总量。

问题再现:

一,二个cube使用同一个模型就是同一张物理事实表。

二,二个cube同时包含相同的topN度量

三,二个cube状态都是Ready

目前我暂时的解决方法是在其中一个cube去掉一个topN度量

同一个sql在hive与kylin里查的的结果对不上相差很远,下面给出sql

SELECT IP ,
 SUM(ACCESS_COUNT) c
FROM API_ACCESS
WHERE TAG_DATE = CAST('2018-11-19' AS DATE)
 group by ip
ORDER BY 
 c DESC
LIMIT 10;

二个cube中的度量:

 cube1:

!image-2018-11-20-10-57-28-546.png!

cube2:

!image-2018-11-20-11-01-25-120.png!



--
This message was sent by Atlassian JIRA
(v7.6.3#76005)