BI技巧丨RANKX浮点运算

alt

RANKX这个函数,白茶之前已经写过很多期了,本期是对RANKX函数一个细节问题的补充。

我们常见的数据类型有很多,用来聚合的主要有三种数据类型:文本、整数、小数。

在大部分场合,小数是实际FACT数据中最为常见的数据类型,当小数与RANKX函数组合的时候,会产生意想不到的小问题。

案例数据:

alt alt alt

案例数据比较简单,分别是产品表、分店表、销售事实表。

细心的小伙伴可能已经发现了,产品表中的价格和成本并不是整数,而是位数较多的小数。

将其导入到PowerBI中模型如下:

alt

构建基础指标:

1.销售金额:

001.SalesAmount = 
SUMX ( 'Fact_Sales', 'Fact_Sales'[Quantity] * RELATED ( Dim_Product[Price] ) )

2.销售成本:

002.SalesCost = 
SUMX ( 'Fact_Sales', 'Fact_Sales'[Quantity] * RELATED ( Dim_Product[Cost] ) )

3.销售毛利:

003.SalesProfit = 
[001.SalesAmount] - [002.SalesCost]

4.在分店表维度下,进行排名:

004.ProfitRankx = 
IF (
    HASONEFILTER ( Dim_Store[City] ),
    RANKX ( ALLSELECTED ( 'Dim_Store' ), [003.SalesProfit] )
)

展示效果如下:

alt

看到这里小伙伴会说,这不是挺正常的嘛,没看出来哪里不对啊。

别急,我们添加一个切片器,来查看一下筛选的效果。

alt

问题描述:

这里有一个很明显的问题,就是白茶RANKX函数内部使用的是ALLSELECTED函数,那么我们得到的排名结果应该是相对排名。

不添加切片器筛选的时候,总体排名和绝对排名是一样的,看起来没什么问题,但是一旦我们添加了切片器筛选,就会明显的看到,两个数值不同的度量值排名居然是一样的。

alt

这个问题产生的原因在于,我们计算依据的物理列价格和成本是包含小数的,多组小数格式数据计算会产生浮点数据,因此在底层逻辑转化过程中会造成数据的精度丢失。

因此解决办法有两种:

1.数据进入到PowerQuery中时,我们进行数据截断;

2.在计算结果上进行数据截断。

白茶推荐大家使用第二种方式,毕竟在PowerQuery中修改数据格式再进行数据UAT测试的时候,是很容易造成上下游数据偏差的。

修改RANKX度量值如下:

005.ProfitRankxAmend = 
IF (
    HASONEFILTER ( Dim_Store[City] ),
    RANKX ( ALLSELECTED ( 'Dim_Store' ), ROUND ( [003.SalesProfit], 2 ) )
)

展示效果如下:

alt alt alt alt

这里是白茶,一个PowerBI的初学者。 alt

Fabric丨白茶 文章被收录于专栏

数据分析进阶之路,带你深入了解可视化技巧。

全部评论

相关推荐

10-28 15:45
门头沟学院 C++
西南山:海康威视之前不是大规模裁员吗
点赞 评论 收藏
分享
09-29 11:19
门头沟学院 Java
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务