avatar-decorate
SamFeng山风 level
获赞
260
粉丝
192
关注
27
看过 TA
291
厦门大学
2022
数据分析师
IP属地:上海
jin qun 关注数据道术器公众号
私信
关注
头像
2021-12-13 20:29
厦门大学 数据分析师
大家好,我是你的老朋友,数据道术器SamFeng。    在实际应用中我们也常常能看到给回归方程引入交互项的形式来考察分组之间的差异,交互项即某个解释变量乘以虚拟变量。例如我们考虑对用户性别进行分组,研究年龄和点击率之间的关系时,我们可以将虚拟变量设计为:男性标为1,女性为0,之后用年龄变量乘以虚拟变量。    那么问题来了,引入交互项和直接把样本分成男性组、女性组后进行分组回归在实际应用中该如何抉择呢?    为了弄清楚这个问题,我们必须站在对这两种操作的深刻理解上。    一、交互项回归和分组回归的差异    这两种操作方式的差异集中体现在两种方法的假设上:交互项回归假设除了核心解释变量外的控制变量系数一致,分组回归则放松了这个假设,允许核心解释变量和其余控制变量系数不一致。    通过观察公式结构,我们便可以清晰地看到这两种操作方式的差异。    首先是交互项回归:    其中X1是核心解释变量,Ci是其他控制变量。可以看到,虚拟变量取值不同时,回归方程的差异仅仅体现在截距项和核心解释变量X1系数上。    接下来我们看看分组回归的结构:    可以看到,在分组回归中,我们放松了解释变量系数一致这个假设要求,我们允许在不同分组,解释变量系数可以不一致。    二、不能用分组回归的情形   在前面的一顿展示后,相信大家都能了解交互项回归和分组回归两组操作方法,在实际应用中这两种方法确实区别不大。比如我们分组的依据选取的是用户的性别、地域、职业等。以样本属性作为分组依据时,交互项回归和分组回归仅仅体现在前置假设上。   那什么时候,我们不能用分组回归呢?   这里先给出答案:当分组依据不是样本属性,而是时间属性时。   样本属性作为分组依据,我们可以把样本完 美的 分成若干组,每一组中的个体信息都是完整的。比如我们现在有1000个用户的点击历史数据,当我们分组的依据是不同的时间段时,每个分组的时间段中,我们得到的都是1000个用户在该时段的信息。也就是说时段i有1000个用户的点击信息,时段j也有1000个用户的点击信息。    这种情形如果我们使用分组回归的方式来探究不同时间段下用户点击规律差异的话,我们就无法解释点击率差异的产生是核心解释变量X1的差异引起,还是其他控制变量Ci的差异引起的。   
0 点赞 评论 收藏
分享
头像
2021-11-03 17:00
厦门大学 数据分析师
聊聊怎么选心仪offer(上)宏观篇   脱离0 Offer焦虑的大伙们,貌似开始进入了新的焦虑中—“多个Offer该如何选择?” Offer选择也成了近期群内的主要热度话题。    Offer选择是我亲身经历过的,所以这篇文章会更加贴近我的过往,我会结合我个人的思考来聊聊该怎么选Offer。本文会分上、下宏观、微观两部分。其中本文主要探讨选择Offer需要考虑的宏观因素:城市、赛道&前景。       一、城市    城市选择无非是要考虑两种情形:    ①常驻城市    ②城市a工作几年后,回归原城市b    对于情形①,由于涉及长期发展,因此当地的户口、住房、教育、消费都需要谨慎考虑,与之紧密联系的就是不可不提的“钞能力”了,在选择Offer时可以结合谈薪结果和当地花销来综合分析,选择待遇相对较好的厂子好好干,逐步落实落户和住房吧。对于这种情形,个人认为待遇为首,发展次之。    对于情形②,由于只是中短期的发展,因此当地户口并不是刚需,这时需要考虑的是企业的发展前景和个人的发展路径,在相同的时间内在哪家公司可以得到更多成长,这些成长和积累是日后跳槽的无形资本。而个人积累和工作内容、业务线、工作氛围等外部因素密切相关,这些信息可以从HR、业务Mentor、未来同事处收集。个人看来,对于情形②发展为首,待遇次之。    二、赛道&前景    赛道和前景其实分别是政策宏观、企业微观的两个因素。    首先我们来聊聊赛道。    考虑赛道的时候可以结合当下政策大方向来思考,比如“双减”、“共同富裕”、“碳中和”、“一带一路”等。   譬如“共同富裕”下的房地产行业、中介行业也将走下坡路,公司业务在政策限制下受影响,公司的财务会直接反映。公司在财务不佳的时候最常见的就是把枝节业务砍掉、开源节流,集中资源在最有可能拉动企业复苏的业务上。在这种业务切换的时期,裁员也是常见的操作,同样公司也会考虑把人力资本用到性价比最高的员工身上,员工性价比就是指员工产出和其工资的比例,由于校招生通常都处于适应和学习的阶段,也就自然成为了性价比较低的裁员对象了。    相似的例子相信大家都在脉脉、牛客上看到不少。因此在赛道选择时一定要保持理性、多结合当下的施政方针和国家发展方向综合考虑。
投递脉脉等公司10个岗位 数据分析求职圈
0 点赞 评论 收藏
分享
头像
2021-11-03 00:34
厦门大学 数据分析师
数据道术器,构想的是向有志于从事 数据分析 、商业分析的朋友们介绍数据入门的思维框架、分析方法和常用工具的。下面这篇推文将会作为分析领域的提纲式文章,给大家简要地介绍下分析领域技能树。针对每一个技能分支,将会在后续的更新中逐一地、深入地介绍,敬请期待。一、数据之道数据领域的思维框架是分析展开的根本,是分析的灵魂和顶层设计。在 数据分析 领域我们需要了解和掌握以下几个基本的思维框架。①群组分析②RFM分析③AARRR模型④漏斗分析⑤生命周期分析⑥留存、流失分析⑦竞对分析上述几个基本的思维框架逐一学习后,分析最迷人的部分在于我们需要对基本思维框架进行排列组合,有机地将群组分析、RFM分析结合到其他框架中,组合之后我们就可以得到不同分群的更多行为、习惯信息,而这些信息都将是发现问题、推动业务的秘密钥匙。数据思维框架是 数据分析 从业的门槛之一,而且这个门槛是能决定职业高度的。在校招期间不时能听到一些同学说数分岗位“门槛低”,其实我觉得这个岗位门槛不算低,在投递时你需要有充足的实习、对基本的统计知识、编程知识、模型知识熟悉。入门后业务上要做到极致,能灵活地应用好上述思维框架到分析报告的话,数分岗的上界也很高的。二、数据之术在顶层思维框架的指导后,在落实分析的环节我们需要合理地使用合适的 数据分析 方法来解决相应问题、得出相关的结论。数据之术是数据领域从业不可不掌握的部分。只有分析工具掌握到位,才能逐步完成思维蓝图。数据领域常常涉及的分析方法有:①假设检验②因果(归因)分析③回归分析④相关分析⑤聚类分析⑥生存分析⑦对比分析上述提到的数据分析方法也许只是众多方法中的一部分,在实际业务 中兴 许需要更多分析方法,这就要求我们需要拥有持续学习的能力,在职场中随时捡起新方法,学习并加以应用。 数据分析 方法则是数据从业的又一门槛,这部分门槛通过学习和培训是不难越过的。觉得数分岗门槛低的吃瓜群众其实大部分只是看到了这部分工具性技能的门槛而已,这部分门槛是决定了你是否能入门。三、数据之器数据分析 常用工具可以结合 数据分析 工作流程来进行介绍。 数据分析 工作永远逃不开:取数、分析、可视化三大环节,与之相生的就是SQL、Python等、和Powerbi(Tabula等)。与数据之术类似,数据之器也是数据领域从业入门的基本门槛。
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务