阿里数据科学家、腾讯PCG数分、平安科技数分、快手数分面经
一面:
自我介绍
挖简历的几个小部分
印象比较深刻的有 在空间上线性可分的两类点,分别向SVM分类的超平面上做投影,这些点仍然是线性可分的吗?给出证明(反证法 假设线性可分 …… 可得出与最大间隔矛盾)
SQL行转成列(case when)
相关性代表因果吗?为什么
Python编程(具体我忘了)
时间序列分析 ARMA模型 如何定阶 (记得要先保证序列平稳偶)
然后问了我对ARMA了解到什么程度 (我回答最后都可以写成一个特征方程,判断根来研究ARMA)
随机森林以及Lightgbm 变量重要性是如何计算的(他纠正我说这俩是一样的,其实是他错把随机森林的变量重要性与lightgbm计算一样 我挺无语的)
这个组主要做因果分析,问我感不感兴趣,以及给我介绍了一下因果分析,以及他们的研究。
二面:
面试官说由于一面已经考察过算法与数学基础,所以这一面主要是聊一聊(深挖简历),
如何将问题转化,你认为自己研究的贡献是什么,研究取得了什么可以看得见的效果,
研究方向与导师不一样你为什么选这个导师?
问介意学一些与数分无关的语言吗,比如java,go,
如果衡量变量之间的因果关系(不需要考虑因果推断),面试过程大概1小时。
平安科技数据分析
工作描述:目前的项目是保险的数据分析,既需要建模,也需要做一些数据的描述性分析,指导保险代理更加合理透明。
自我介绍,深挖了简历中一个项目的模型,lightgbm的原理,
Lightgbm比xgboost好在哪
以及随机森林 与GBDT、xgboost、lightgbm的区别,
还有就是决策树的的划分准则有哪些(信息增益,信息增益率,基尼系数)
模型过拟合怎么办
Pandas的几个函数
写SQL
总结:需要业务但是业务考察较少,当时就给了口头offer,注意平安需要做个人测评,那个做的分数低了也是不行的。
快手数分面经:
一面:
自我介绍,深挖之前实习经历,因为之前在某快消做数分,问复购的归因是如何做的?(给我一个新的场景 去下钻影响新老客购买率因素)
欠品预测建模用到了什么自变量,lightgbm模型效果如何?
提出场景问题,如果日活跃用户量下降了,如何从数据找到原因?(
1数据的准确性以及是否存在异常
2下降的维度是随时间下降,还是跟别人的差距变大了
3从几个常见维度拆分
按照新老用户的拆分;
登入平台的的拆分,比如:IOS、安卓;
按照APP版本进行拆分;
按照登录渠道的拆分,比如APP、小程序;
按照区域的拆分,比如:国家、省份;)
二面:
自我介绍,我简历中有写用图模型做商品关联分析,面试官问如何应用的?然后就是各种深挖简历,问模型效果如何,用的什么模型评价标准。
记不清了,好像又问了一些业务问题,然后问了下之后想要的职业发展方向,以及给我了一些建议。