假设检验-带有概率的反证法
2.假设检验步骤
2.1将实际问题提炼为统计问题
2.2 建立一对相互对立的假设(原假设和备择假设),确定检验方法
原假设:无差别的、不起作用的、公认的、不证自明的、符合规则的
备择假设:有区别的、起作用的、需要证明的、违反规则的
常见假设情形:分布的验证、变量相关性、均值比较、方差比较
2.3 确定显著性水平(大多数情况下取0.05)
2.4 验证前提条件
2.5 确定检验统计量
2.6 根据检验统计量计算出拒绝域
2.7 根据样本计算检验统计量的值并判断在不在拒绝域
2.8 将统计判断结果转换成实际结果
3.有关平均值参数的假设检验
3.1方差已知时均值检验统计量分布---Z检验
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法(总体的方差已知)。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
- 如果检验一个样本平均数(X)与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:Z=
- 如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:
3.2 方差未知时均值检验统计量分布---T检验
- 如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:
- 如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为:
它们的语法是一样的,如下:
5.斐波那契数列实现 ROW_NUMBER() OVER([PARTITION BY col1] ORDER BY col2)
DENSE_RANK() OVER([PARTITION BY col1] ORDER BY col2)
RANK() OVER([PARTITION BY col1] ORDER BY col2)
三个函数都是按照col1分组内从1开始排序
区别:
rank(): 相同的两名并列,下一数字会跳过,两个第二名下来就是第四名。
row_number():无论是否相同的数值,依然是按顺序排序。
denes_rank():相同的两名并列,下一个名词不会跳过,两个第二名仍然跟着第三名。