数仓概念-维度与颗粒度

今天有同学问语兴,颗粒度和维度到底是什么关系,有些分不清,这里用一篇文章和小案例,来详细给大家讲清楚维度与颗粒度。

颗粒度

颗粒度描述的是一个业务流程的主体,反映了数据记录的细节程度。

在一个业务流程中,通常会有一些核心实体或者事件作为数据的主要标识,例如订单表中的订单ID,员工离职表中的员工ID,这些都可以视为颗粒度,换句话说,颗粒度是数据的粒度,决定了每条数据记录的唯一性和独特性。

例如:

在订单表流程中,订单ID是主体,代表每个独立的订单。

因此,订单ID就是颗粒度。

在员工离职表中,员工ID是主体,代表每个独立的员工。

因此,员工ID就是颗粒度。

由此可见,颗粒度可以是维度,也可以是业务流程自有的ID。

它不仅描述了数据的粒度,还定义了数据的唯一标识。

维度

维度是描述事实数据的属性,用来对数据进行分类和汇总,维度提供了对数据进行切片和钻取的视角,帮助我们从不同的角度来分析数据。

例如,常见的维度有时间、地理位置、产品、客户等。在实际应用中,维度的作用非常广泛:

在销售数据中,时间维度可以帮助我们分析销售的季节性趋势。

在市场分析中,地理维度可以帮助我们了解不同地区的销售情况。

在某些情况下,维度也可以转化成颗粒度。

例如,在ADS(应用数据服务)员工晋升标签表中,颗粒度是员工,因为这张表的数据都是基于员工晋升情况进行打标的。

这意味着每条记录都与一个特定的员工相关,因此员工是这张表的颗粒度。

同时,这张表也包含了与员工相关的维度属性,例如部门、职类等。

如果下游业务要查看每个部门的晋升状况,那么需要以部门维度为颗粒度来分析数据。

在这种情况下,部门这个维度转化成了颗粒度,即数据分析的主体变成了部门,而不是单个员工。

因此,为了看清每个部门的晋升状况,我们需要以部门为单位对数据进行聚合和分析。

这体现了颗粒度和维度之间的灵活转化关系。

#你都收到了哪些公司的感谢信?##牛客创作赏金赛##机械制造笔面经##数据分析##数据开发工程师#
全部评论

相关推荐

点赞 1 评论
分享
牛客网
牛客企业服务