【业务知识】数据驱动决策的思维方式
原文出处:https://www.jianshu.com/p/5a8f01fe7f2a
本文仅用于复习,不对外。
一、信度与效度思维
信度:指一个数据或指标自身的可靠程度,包括准确性和稳定性。
例如:
准确性:
(1)取数逻辑是否正确?
(2)有没有计算错误?
稳定性:
(1)每次计算的算法是否稳定?
(2)口径是否一致?
(3)以相同的方法计算不同的对象时,准确性是否有波动?
效度:指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。
例:采用什么指标衡量身体的肥胖情况?
假设采用穿衣的尺码大小。
(1)该指标准确性很差。因为美版韩版和国内版本的尺码衡量标准不一,相同尺码的衣服对应的衣服真正的大小是不一致的。
(2)该指标稳定性很差。穿不同版本的衣服使得衡量标准不稳定。
(1)和(2)说明信度很差。
(3)该指标效度也很差。因为衣服大小并不能体现肥胖程度,还有可能是因为骨架大小而受影响。
综上所述,应该考虑体脂率作为新的指标。
只有在信度和效度上都达标,才是一个有价值的数据指标。
信度和效度的本质,其实就是数据质量的问题,这是一切分析的基石。
二、平衡思维
例:市场的供需关系;薪资与效率关系;工作时长与错误率的关系等。
平衡思维的关键点,在于寻找能展示除平衡状态的指标。这个指标应该是可以衡量天平的倾斜程度的,常用的是比率指标。
三、分类思维
例:客户分群;产品归类;市场分级;绩效评价等。
关键在于,分类后的事物,需要在核心关键指标上能拉开距离。也就是说分类后的结果,必须是显著的。
在图中,横轴和纵轴是运营当中所关注的核心指标,而分类后的对象,它们的分布不该是随机的,而是有显著的集群的倾向。
例:假设上图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表客单价,那么“绿色点”人群就是“剁手金牌客户”。
四、矩阵思维
矩阵思维是分类思维的定性版,即不用量化指标来分类,而是通过经验进行定性分类,大致定义出好坏的方向。
例:波士顿矩阵,又称市场增长率-相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。
![]()
五、管道/漏斗思维
例:注册转化、购买流程、销售管道、浏览路径等。
在实际运用中,要特别注意漏斗的长度。
漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(即第一个环节100%开始,最后一个环节不要低于1%)。
如果不能满足上述条件,建议拆分为多个漏斗进行观察。
原因:
(1)超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型当中分析多个重要问题容易产生混乱。
(2)量级差距过大,不容易发现数值间波动的相互关系,容易遗漏信息。
例如:漏斗最后一个环节0.1%的变动,可能比从60%到50%的变动更致命。
六、相关思维
相关思维的其中一个应用,就是能够帮助我们找到最重要的数据,排除掉过多杂乱数据的干扰。
如何执行?
可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都相对较高的数据指标,分析它的产生逻辑,对应的问题,并评估信度和效度,若都满足标准,这个指标就能定位为核心指标!
注:
(1)可以思考相关系数背后的逻辑,为什么会高(如订单数和购买人数)?
(2)如果不能解释相关系数为什么会高,往往就是得出“惊喜”结论的地方。
七、远近度思维
确定好核心问题后,分析其他业务问题与该核心问题的远近程度,由近及远,把自己的精力有计划地分配上去。
例如,近期的核心任务是提高客服人员的服务质量,那么:
相对近的其他问题有客服人员的话术、客户评价通道、客服系统的响应速度等,这些需要先关注。
相对远的其他问题有客户的问讯习惯、客户的购买周期等,这些暂时先放一放。
八、逻辑树思维
下钻,即在分析指标的变化时,按一定的维度不断的分解。
例如,按地区维度下钻,从省到市,从市到区。
上卷,即汇总。
在不断的细分或汇总的过程中,我们往往能找到问题的根源。
下钻和上卷往往是多维组合的节点。
逻辑树引申到算法领域就是决策树,寻找差别最大(信息增益)的维度进行拆分。直到差别不大不能再细分时,就能找出影响指标变化的因素。
例如,分析全国客户数量下降的原因。
从地区和客户年龄层级两个维度进行观察。
(1)各个年龄段的客户都下降,而地区有的上升有的下降,因此先按地区拆分第一个逻辑树节点。
(2)拆分到省后,发现各省间的差别是显著的,就继续拆分到城市,发现是浙江杭州大量各年龄客户被竞争对手的一波推广活动挖走了。
由此得到了原因。
九、时间序列思维
很多问题,我们找不到横向对比的方法和对象,那么,和历史上的状况比,就将变得非常重要。
这种方式容易排除掉一些外在的干扰,尤其适合创新型的分析对象,比如一个新行业的公司,或者一款全新的产品。
时间序列的思维有三个关键点:
(1)距今越近的时间点,越要重视(图中的深浅度,越近期发生的事,越有可能再次发生);
(2)要做同比(图中的尖头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义);
(3)异常值出现时,需要重视(比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。
时间序列思维可以用在“生命周期”分析当中,生命周期问题衡量清楚,就能很方便地确定一些“阀值”问题,使产品和运营的节奏更明确。
十、队列分析思维
队列分析,即按一定的规则,在时间颗粒度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化。
队列分析的常用场景是留存分析。
例如,假设5.17我们举办了一次促销活动,那么将这一天来的新用户作为一个观察样本,观察他们在5.18、5.19...之后每天的活跃情况。
十一、循环/闭环思维
循环/闭环的概念可以引申到很多场景中,比如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等。
业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局上把握公司的运行状况。
例如,比如,一家软件公司的典型业务流:推广行为(市场部)➡流量进入主站(市场+产研)➡注册流程(产研)➡试用体验(产研+销售)➡进入采购流程(销售部)➡交易并部署(售后+产研)➡使用、续约、推荐(售后+市场)➡推广行为,一个闭环下来,各个衔接环节的指标,就值得关注了:广告点击率➡注册流程进入率➡注册转化率➡试用率➡销售管道各环节转化率➡付款率➡推荐率/续约率...
注意:这里会涉及漏斗思维,如前文所述,千万不要用一个漏斗来衡量一个循环。
十二、测试/对比思维
即A/B test。
注意:
(1)在条件允许的情况下,决策前尽量做对比测试;
(2)测试时,一定要注意参照组的选择,建议任何实验中,都要留有不进行任何变化的一组样本,作为最基本的参照。
补充(AAtest的作用):
AA指的是实验中的各个方案都是一致的。这么做的目的是啥?这是为了测试埋点、分流、实验统计的正确性,增加AB实验的实验结论可信度。
十三、指数化思维
指数化思维,是指将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维),来持续追踪的方式。即要把多个指标压缩为单个指标。
指标思维的三个关键点:
(1)遵循独立和穷尽的原则;
即你所定位的问题,在搜集衡量该问题的多个指标时,各个指标间尽量相互独立,同时能衡量该问题的指标尽量穷尽(收集全)。
(2)要注意各指标的单位,尽量做标准化来消除单位的影响;
(3)权重和需要等于1。
例,当初设计某公司销售部门的指标体系时,目的是衡量销售部的绩效,确定了核心指标是销售额后,我们将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的指标,且这5个指标涵盖了销售绩效的各个方面(穷尽)。我们设计的销售绩效综合指数=0.4*订单数+0.2*客单价+0.2*线索转化率+0.1*成单周期+0.1*续约率,各指标都采用max-min方法进行标准化。
十四、人货场思维
人是指客户、内部员工;
货是指商品、产品;
场是指企业环境、行业环境、活动环境。
记住“人货场”这三个维度,能够在绝大多数的业务背景下,相对全面&有逻辑的列举出影响因素,针对每一个有可能影响最终结果的因素进行一一验证,得到结论。
例,GMV下降了20%应该怎么分析?
(1)从“人”的角度:主要考虑新老客户、不同地区、不同渠道、不同忠诚度客户等维度,通过数据一一验证。
假设数据表明,新客户的GMV同比下降25%,老客户的GMV同比上升2%,则可以将原因定位在新客户中。推测可能是拉新活动失效,使得新客户下单减少。
(2)从“货”的角度:主要考虑不同品类、不同价位、不同商家等维度。
假设数据表明,手办品类的商品GMV占总GMV的30%,但手办品类的GMV下降了35%,则可以将原因定位在手办品类中。推测可能是手办品类的质量不佳。
(3)从“场”的角度:主要考虑企业内部活动、行业情况等维度。
假设数据表明,今年活动数量比去年要少20%,则推测可能是活动数量减少导致GMV下降。