shein 产品实习生(数据科学方向)业务面
前前后后聊了30多分钟,面我的就是入职后的直属leader,30来岁,人很nice,答得差也完全不会嫌弃,一直在积极鼓励,很温暖,感恩!
考察的内容也是事无巨细,很互联网大厂既视感,本人懒得好好准备,果然翻车。。。anyway。。。浅浅记录一下。。。
说所在的部门是流量策略部,关注上架新品的流量的选择投放比例,常需要与算法部门对接,故需要了解一些基本的算法知识。
岗位一进去会有3节课进行培训:
①数据埋点(互联网用的多) 爹的根本没准备
②说说AB test的基本流程 了解得不够透彻
③数据分析
一、进行自我介绍
二、关于前两段实习为什么都只有1-2个月?(准大三 学业和实习的trade off)
三、拿出1个月之前的笔试题,因为我有用到SQL窗口函数,故细究我SQL窗口函数的具体基本知识(根本不记得哈。。。)
SQL题1:专用窗口函数rank, dense_rank, row_number有什么区别呢?
SQL题2:怎么写数据库代码可以提高效率? 爹的 一顿乱答 因为没有怎么考虑过这个问题,只是跑出来即可
四、了不了解 数仓? 不了解SOS
五、概率统计的知识(都答了一点,但是由于年代久远,好多记不起细节)
1.数据分布偏左、偏右、正态分布,众数、中位数、平均数的大小如何?
2.如何找数据集的outlier?
3.“多重共线性”是什么?怎么导致的?如何处理“多重共线性”?
4.看了看我的kaggle项目:说说回归、决策树、随机森林的区别?
本场唯一会答的题!
①线性VS非线性
②模型准确性VS可解释性
③树-->集成-->回归
六、偏产品经理的知识 完全纯纯小白,有时间补补业务知识。。。每题都是非常不规范的答题,感觉也不是很在点上。。。
1.点进淘宝主页,如何对产品进行多样化检测?
。。。根本没懂在说啥,瞎说。。按照目标客户、客户历史评价历史数据、价格区间、产品类别、产品发货地等维度进行分类???。。。
2.说说AB test 浅准备,但是很多细节不清楚,比如问我确定sample size的方法有哪些,我只能答出,n是与significance level有关,通常先确定significance level,后确定n。。。