阿里淘天集团数据科学暑期实习凉面
报个面经攒人品
TL 3.21投递 4.3笔试 4.7约的面试,4.8面试,约40分钟
淘天的笔试感觉是我最近做的笔试中成绩最差的,没想到第一个拿到面试。
面试官先是介绍了团队的工作内容,然后要我做自我介绍。
之后是笔试部分,首先是sql题,给定use_id和ordercount,要求ordercount的90分位数,我当时太紧张忘了percentile_cont怎么拼写,用的是order by 加limit round(count(*)*0.9)写的。先手就出问题了。
之后要求手搓一个聚类算法(因为我在自我介绍时说了我会手搓),要求是伪代码就行,我写了kmean,步骤有点乱,在差不多快写完的时候面试官说ok了可以下一个了。
然后要求讲述建模的整个过程。我就讲了一段银行数据建模的经历。我把主要重心放在数据预处理上了,还讲了讲损失函数的选择,其他部分都是一笔带过(毕竟我当时选模型调参数啥的都是随便搞得,根本没什么章法,自然讲不出来)。后来被面试官狠狠拷打,说像为什么选这个模型,对于不同十分位数据的准确率的分析都没有。(感觉她讲这个的时候我已经无了)。
再之后是一道业务题,某个地区某些商品进行了降价,让我分析该促销是否导致了营收增长(既要分析商品又要分析地区)没有ABtest。我就说对商品的销量曲线分三类:平稳型,周期型,增长型,然后前二者找到对应时间段的可参考数据求平均,做检验啥的.增长型要求先按时间序列建模巴拉巴拉的。
最后接着上一题,要我说一下各种检验的条件、应用场景等。
最终反问环节,对我的评价(大概意思):基础还不错,但是建模等实操用的都是学院派的数据,缺乏实际生产的应用能力。(寄)
复盘:面试太紧张了,面试官好几次问我是不是紧张,然后再去kaggle上找一点复杂的数据集做一下实战项目吧,希望能有用......
#数据人的面试交流地##淘天暑期实习##数据科学家#