DA/DS/BI 必考AB实验知识点

哈喽大家好,我是六哥~

最近在面试中我发现一个共性问题:

虽然关于AB实验的基础原理、步骤大家了然于胸

但只要问到一些稍微深的东西,例如:

AB实验中评估指标的相关细节

很多人的回答多少还是差那么点意思

之前已分享过『AB实验』系列专题(见主页往期分享)

  • 数据分析岗 | AB实验框架+高频考点(一)
  • 【数据分析岗】| AB实验之方案设计(二)
  • 数据分析岗 | AB实验之实验分流(三)
  • AB高频考点!大白话讲懂『多重检验』
  • 常被忽略的『AA测试』| AB系列(五)
  • 概率论系列考点 — 统计功效 | 最小样本量

本篇,咱就来唠一唠

AB实验中常见指标分类有哪些?咋用?

内含注意事项tips,可收藏慢看

------正文手动分割线------

本文结构速览:

一、搞清概念

二、计算差异

三、选择原则

四、注意事项&case自查💡

一、搞清概念

AB实验中的常见指标,按照业务方式分类:

  • 目标指标:又被称为北极星指标,即一般是公司业务核心KPI
  • 驱动指标:又被称为间接指标,与目标指标之间在逻辑上有因果关系,但比它更快更灵敏
  • 护栏指标:顾名思义,作为“保护型”指标,是每个测试都需要观察的指标,一般有两种类型:
  • 保证目标指标不会违背重要的限制:一般为衡量用户不好体验的指标,如加载率、崩溃率等等,一般而言不能对其有显著负向影响才可以
  • 评估实验结果的可信赖度和内部有效性:常见的如SRM,如若出现问题实验中其他指标评估结果基本不可信

如果按照统计类型分类:

  • 计数求和型:即样本的指标之和,比如有uv、pv、总时长
  • 复合计算型:均值类、比例类、比率类
  • 均值类:即样本的均值,如uv价值、人均时长
  • 比例类:即每个样本服从二项分布,如用户点击率、用户购买转化率
  • 比率类:即两类指标的比值,如pv点击率、ROI等等

二、计算差异

在抛公式前,需要有个大致概念:

一般情况下,不同指标的差异主要体现在假设检验时方差的计算方式上。这是因为不同指标的计算方法往往考虑了不同的信息,从而导致了方差的计算方式也会有所不同。

因此,正确估计指标的方差是获得可靠的实验结果的前提。

在实际业务中,常用的是参数检验中关于均值类、比例类 这类统计量的组间差异检验。另外,多说一嘴:有关计数求和型指标,只有当实验对照组样本一致的情况下,这类绝对值指标的对比才更具意义,否则还是需要转换成以上指标才可以对比。

讲具体每个指标的差异前,抛出一张脑图,供大家概览:

▌均值类:

均值类指标是基于正态分布做计算

大多数情况下,样本充足,选用Z检验:

(因假设实验对照组均值分布无差异,即:u1-u2=0)

▌比例类:

比例型指标是基于伯努利分布做近似计算:

如果实验对照组样本比例相同,即:

▌比率类:

如上,无论是均值类指标的检验采用正态分布计算方差,还是比例型指标的检验采用二项分布方式计算方差,其实这里有个适用前提假设,即:

需要满足样本独立同分布

但这里比率型指标是不满足的。AB测试一般在用户层面进行随机化分流,如若指标的分析单元不是用户,例如pv点击率,是点击pv/曝光pv,这里分析单元中的每个曝光Yi可能来源同一个用户,各样本点不满足独立性,所以方差计算需要做下修正,不可以直接套用。

关于这类指标,业界常用的方式例如有:delta method进行修正,或者bootstrap方式计算方差的无偏估计。

① Delta method:

  • 优点:计算简便,需满足一些基本假设,大多数情况下即可利用一阶泰勒展开,在很低的计算成本下获得准确的方差估计,效率更高
  • 缺点:仅适用于大样本,且对统计量形式有限制

② bootstrap方式:

  • 优点:形式简单,容易理解,适合任一统计量,且对样本量没有限制
  • 缺点:成本高,耗时长,需要较大算力来支持重抽样次数

其中Delta method方式,计算修正后的样本方差:

ps.有关此方法的推导感兴趣可私信留言~

三、选择指标原则

通常情况下,在实际工作中,大多数人会按照过往经验或者业务感觉来选择实验评估指标,虽然很少出现问题,但还是需要清楚底层关键需要满足以下几个原则:

  • 易懂性:指标是为了反应某种事物和现象的一种量化方式,所以需要容易理解且可衡量实验效果
  • 一致性:需要和AB实验采取策略的目标保持一致,方便衡量干预措施和数据结论有一定因果逻辑
  • 灵敏性:AB实验本质是为了利用数据驱动的方式为业务策略探路验证用的评估方法,倘若选取的指标很难检测到差异,可能会错失增长良机,或者没及时发现问题止损而付出更大代价,所以需要选取的实验指标保证灵敏性

四、注意事项

▌指标个数

指标不在多,否则会出现多重检验的问题,置信度会下降。(详见👉:AB高频考点!大白话讲懂『多重检验』)最好先有预期目标,制定评估标准以及预计提升值,而后AB实验更多发挥的是因果验证作用。

▌指标识别

指标计算时要注意:随机分流的实验单元和分析单元需保持一致,否则不满足假设检验中的前提条件:独立性。如果不满足,则需要对方差计算进行修正,否则检验结论出错概率较大。

▌case自查:

实验组和对照组uv价值的相对差异,是否可以用传统计算方差方式?

  • 答案:不可以,需要进行方差修正。
  • 提示:可以将该指标列出,观察分母:对照组的uv价值是常数还是随机变量,可以发现新的统计量需要计算的是实验对照组uv价值比值的方差,即需要用到比率型指标的估计方差方式。

以上就是为大家分享的AB实验中关于:

评估指标差异的定义、分类、注意事项

面试官亲自出的『56道AB实验真题』,求职不迷茫

#数据分析##数据分析面试##数据人的面试交流地##数据分析师#
全部评论
AB实验中评估指标傻傻分不清 | AB系列(六)
点赞 回复 分享
发布于 06-12 00:01 北京
dd
点赞 回复 分享
发布于 06-13 15:33 上海
{"pureText":"","imgs":[{"alt":"nowcoder_171****218432.jpeg","height":1440,"localSrc":"","src":"https://uploadfiles.nowcoder.com/message_images/20240615/163768403_1718422219133/nowcoder_1718422218432.jpeg","width":1080}]}
点赞 回复 分享
发布于 06-15 11:30 上海

相关推荐

不愿透露姓名的神秘牛友
11-20 19:57
已编辑
某大厂 golang工程师 23.0k*16.0, 2k房补,年终大概率能拿到
点赞 评论 收藏
分享
牛客722552937号:新锐之星有点坑爹,特别是对男的
点赞 评论 收藏
分享
10-24 13:36
门头沟学院 Java
Zzzzoooo:更新:今天下午有hr联系我去不去客户端,拒了
点赞 评论 收藏
分享
4 10 评论
分享
牛客网
牛客企业服务