数据分析|群组分析

大家好,我是数据道术器SamFeng。

    近期楼主在忙毕业论文,在实证部分用到的一些方法其实跟数据分析中的群组分析是异曲同工的,因此准备跟大家分享一下。其中用到的统计软件是stata,这个软件在统计方面属于利器:方法齐全,使用方便,感兴趣的朋友也可以关注了解了解。



一、群组分析简介

    群组分析在数据分析领域属于常见的操作,在实证分析范畴跟异质性分析是类似的。主要都是从样本中提取一些来自样本的特性,这些特性是导致数据层面差异的源头,基于这些特性对样本进行进一步的分析,从而挖掘出分组样本的不同规律。

    这里简单总结一下群组分析的步骤:



    ①明确业务分析目标。

    ②基于业务提出样本分组依据。

    ③对分组样本进行(回归)分析。   

    在业务上常见的分组特征有:性别、年龄、地域、职业等,这些特征先验得决定了一个个体在行为上可能存在的差异。举个例子,双十一购物节,男性和女性在购物的支付行为、策略、偏好等方面都因性别而存在差异;消费者身处不同地域,因所处地域的气候、经济和自身职业等因素的综合影响,在消费时也会存在差异。

图片

    从这些差异中我们能挖掘出什么信息呢?基于群组的差异,我们可以设计出不同的推荐、运营策略,这些策略最终是为了提高不同群组的用户体验,进而实现业务的增长。



二、实证分析往事

    做实证分析时我基于上述群组分析的逻辑,在探讨经济不确定性对消费的影响时考虑了城市间的异质效应。这部分分析的样本主要是城市的人均消费支出和经济不确定性,以及其他一些重要的控制变量。

    图片

    各个城市的人均消费支出作为被解释变量,经济不确定性作为核心解释变量,由于各个城市都有各自的人均消费支出时间序列,因此我们得到的是面板数据(m个城市,每个城市有样本长度为n的消费支出时间序列)。这里我们考虑的分组特征是城市等级,也就是说我们想探讨的是不同级别的城市,城市的人均消费支出受经济不确定性影响的差异。

   得出的结果是有趣的:经济不确定对于发达城市和欠发达城市的人均消费支出都有显著的抑制作用,而其对发达城市的消费抑制程度更大。这是为什么呢?这时我考虑到之前实习时学到的一招:路径分析,于是我开始思考居民收入的可能去向。

   不难想到,收入去向无非是消费、储蓄、投资。这正是解释上述不确定性对消费抑制程度差异的突破口。我提出一个猜想:发达城市居民较于欠发达城市居民具有更强的风险抵御意识、更丰富的风险转嫁方案:投资&储蓄,因此在不确定性较高时,发达城市居民更倾向压缩消费,转向储蓄和投资以抵御经济不确定。到这里,故事就结束了吗?当然不。

图片

   

    为了进一步严谨地论证上面猜想的合理性,我令城市储蓄作为被解释变量、经济不确定作为解释变量,按照城市等级分组再次进行了面板回归。出来的结果是:经济不确定性对发达城市和欠发达城市的人均储蓄均呈现显著的促进作用,而其对发达城市的人均储蓄促进程度更大。也就是说,从数据事实来看,发达城市居民消费受不确定性抑制程度更明显的现象可以解释为发达城市居民在不确定性下扛风险意识更强,更倾向于提高储蓄来应对宏观风险。到这里,关于经济不确定和消费的故事可以暂时收尾了。

   事实上,上面的实证分析用到的就是群组分析的思想,只不过分析的对象从个体、群体扩展到了城市。以上分析仅给出了事物发展规律的捕捉,基于这些规律,站在social planner的角度我们能提出哪些建议呢?这又是一块值得思考的内容,这部分内容恰恰是业务策略的构思。因此群组分析思想无论在学术实证分析还是业务数据分析中都是共通的。



三、分析时遇到的一些新事物

    在分组回归后,看到存在差异的系数,本人是欣喜的。但下一秒本人便陷入了沉思:系数的差异是否显著?系数是否可比?系数的差异是否稳定?这些问题也许会在答辩场上被逐一提问,如果没有提前解释,人没了是分分钟的事情。

    庆幸的是,对于异质效应、分组回归的系数检验问题早被统计大家们解决。在知乎畅游的时候看到相关检验起码有以下三种:

    ①引入交叉项

    ②SUEST (基于似无相关模型SUR的检验)

    ③费舍尔组合检验

    此处给出知乎传送门https://zhuanlan.zhihu.com/p/28502370,感兴趣的朋友们可以去拜读一下中大岭院连玉君副教授的总结。

    三种方法中,费舍尔组合检验感觉在使用上比较方便,因此推荐一下。


#数据分析#
全部评论

相关推荐

避坑恶心到我了大家好,今天我想跟大家聊聊我在成都千子成智能科技有限公司(以下简称千子成)的求职经历,希望能给大家一些参考。千子成的母公司是“同创主悦”,主要经营各种产品,比如菜刀、POS机、电话卡等等。听起来是不是有点像地推销售公司?没错,就是那种类型的公司。我当时刚毕业,急需一份临时工作,所以在BOSS上看到了千子成的招聘信息。他们承诺无责底薪5000元,还包住宿,这吸引了我。面试的时候,HR也说了同样的话,感觉挺靠谱的。于是,我满怀期待地等待结果。结果出来后,我通过了面试,第二天就收到了试岗通知。试岗的内容就是地推销售,公司划定一个区域,然后你就得见人就问,问店铺、问路人,一直问到他们有意向为止。如果他们有兴趣,你就得摇同事帮忙推动,促进成交。说说一天的工作安排吧。工作时间是从早上8:30到晚上18:30。早上7点有人叫你起床,收拾后去公司,然后唱歌跳舞(销售公司都这样),7:55早课(类似宣誓),8:05同事间联系销售话术,8:15分享销售技巧,8:30经理训话。9:20左右从公司下市场,公交、地铁、自行车自费。到了市场大概10点左右,开始地推工作。中午吃饭时间大约是12:00,公司附近的路边盖饭面馆店自费AA,吃饭时间大约40分钟左右。吃完饭后继续地推工作,没有所谓的固定中午午休时间。下午6点下班后返回公司,不能直接下班,需要与同事交流话术,经理讲话洗脑。正常情况下9点下班。整个上班的一天中,早上到公司就是站着的,到晚上下班前都是站着。每天步数2万步以上。公司员工没有自己的工位,百来号人挤在一个20平方米的空间里听经理洗脑。白天就在市场上奔波,公司的投入成本几乎只有租金和工资,没有中央空调。早上2小时,晚上加班2小时,纯蒸桑拿。没有任何福利,节假日也没有3倍工资之类的。偶尔会有冲的酸梅汤和西瓜什么的。公司的晋升路径也很有意思:新人—组长—领队—主管—副经理—经理。要求是业绩和团队人数,类似传销模式,把人留下来。新人不能加微信、不能吐槽公司、不能有负面情绪、不能谈恋爱、不能说累。在公司没有任何坐的地方,不能依墙而坐。早上吃早饭在公司外面的安全通道,未到上班时间还会让你吃快些不能磨蹭。总之就是想榨干你。复试的时候,带你的师傅会给你营造一个钱多事少离家近的工作氛围,吹嘘工资有多高、还能吹自己毕业于好大学。然后让你早点来公司、无偿加班、抓住你可能不会走的心思进一步压榨你。总之,大家在找工作的时候一定要擦亮眼睛,避免踩坑!———来自网友
qq乃乃好喝到咩噗茶:不要做没有专业门槛的工作
点赞 评论 收藏
分享
白火同学:能。我当初应届沟通了1200,收简历50,面试10左右吧,加油投吧
投了多少份简历才上岸
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务