快手数据科学面经

岗位:Data Science

话不多说!!直接上干货!!!!

首先是数据分析自学经验

关于我:本硕都是读的计算机专业(数科这个岗位对于学统计学的同学来讲比较对口T.T),并且我周围没有做数科的师兄师姐和同学,毕业后大部分都去了前后端研发岗和测开岗,只能自己摸索,也走了不少弯路,所以在这里跟大家分享一下我的经验吧,希望会对你们有所帮助~

技术栈:Python / mysql —— 机器学习 —— 统计学 —— 数据分析项目 —— 业务分析 - - - 大数据
这个没什么捷径,静下心来学吧,以下这些排除工作时间和前期低效的摸索阶段,满打满算准备了3个月吧,每天保证6小时的净学习时间:
· Python / mysql掌握的程度就是能够手动实现业务指标,比如根据数据实现日活和各种率等等,常用的pandas函数需要掌握,数据库开窗函数要知道;
· 机器学习的话不用各个模型全都会,掌握常见的比如LR、SVM、GBDT,常用的模型方法比如梯度下降、防止过拟合要掌握,模型优缺点啥的也要知道;
· 统计学主要掌握正态分布、伯努利分布、二项分布、T检验、卡方检验、方差分析、置信区间,最好找几个小案例练练;
· 数据分析项目就看自己了,面试官问的很细,做到什么程度就写到什么程度!!千万不要抱有侥幸心理!!(因为你根本想不到关于项目会问什么);
· 业务分析对于各位做技术的来讲可能是最头疼的,因为我也是!!!乍一看,什么推断北京有几个咖啡厅,什么竞品分析,什么判断是否要新增某项功能 ....
学习这个没啥捷径,多看多想!我认为方法论还是蛮重要的。强推《深入浅出数据分析》,关于业务还需要掌握一个很重要的方法ABTest。
· 大数据具体点来讲可以学学spark和hive,有的公司(腾讯、京东、映客、陌陌...)会问你懂不懂大数据技术,这个很加分的,但如果时间不够可以先不学,大不了不加分呗~
建议去Bzhan看一下尚硅谷的spark和hive视频,自己搭一下环境,动手敲一遍,spark主要是根据源码学会spark的处理流程框架,能够口述出来,hive就是掌握一些常见的函数,学会处理一些常见小问题(google一下hive常见面试考点)

****** 以上只是我自己的学习经验和技术路线,当然希望大家多多补充、多多提建议!******

下面是这次面试的流程

一面:
1、自我介绍,最好自己先事先准备下,自我介绍也是体现逻辑是否清晰的一种形式;
2、介绍项目,最好也事先准备下,把自己做的数分项目理清楚,不相干的项目就别说了!(比如Java开发、大数据开发相关),在说的过程中一般会打断你问一下,这个地方怎么实现的,用到什么函数,为什么这么实现等等;
3、聊天过程中突如起来的场景分析,第一个场景是国内某打车软件去年发生了不好的事件,该打车软件后来做了一个分析报告其中有个指标是每英里的犯罪率,问:为什么要用英里?答:因为国内的打车类app还不是很成熟,但是国外做这个已经很久了,所以希望跟国外的各参数进行对标;第二个场景是交通事故的严重级别分为五档(死亡、ICU、重伤、轻伤、剐蹭),现在要统计交通事故数,问:统计口径取多大,两种选择,取前四个级别还是全部都取,答:取前四个,因为剐蹭的话很多都私了了,并不会进行登记,所以统计数据缺失会比较严重,造成数据真实性与真实相差较大;
4、用过Python的透视表吗?怎么用,什么场景用,参数的意义... pivot_table函数,不展开了;
5、两个实际业务的描述,用什么方法解决?... t检验;多个呢?... 方差分析;为什么叫方差分析? ... 解释方差分析流程;
6、介绍下熟悉的机器学习模型,svm、xgboost,流程、特点,怎么防止过拟合,过拟合拟合的是什么... 抠的比较细,如何选择一个机器学习模型,会参考哪些因素,剩下的忘记了,还有个问题;
7、有什么想问的?

二面:
1、自我介绍,相同的介绍再说一遍好尴尬,hiahia
2、介绍项目,这次问的更细,都是根据项目展开的就不多说了,就一句话,自己做到哪儿简历就写到哪儿,莫要掺假;(二面主要就是抠项目)
3、关于pandas常用函数,怎么用;
4、有什么要问的?

leader面:
加周末一共间隔了4天被通知前两面过了,安排了三面
1、自我介绍
2、还是介绍项目,这次问的很有个性,总之还是在细抠;回答的时候逻辑性不是很好,都开始自我怀疑这项目到底是不是我做的,哈哈;
3、快手搜索功能的使用率下降了怎么分析,产品、用户角度分别拆分指标去考虑,会根据你的回答一直深入去问,直到答不上来...;想要增加模糊搜索的功能,怎么实施?我是从推荐系统的角度去分析的,基于协同过滤和矩阵因子分解,具体就是利用隐语义模型LFM构建相似度矩阵,利用交替最小二乘ALS得到最优解,当然还是会根据回答继续深挖,直到回答不上来...
4、有什么问题?
说实话三面面的稀碎,以为要被挂了...T。T

过了两天,hr打来电话说过了~ 很开心~ 再次感谢快手爸爸!祝各位早日上岸!


#面经##快手##数据分析师#
全部评论
内推不用参加笔试嘛,我也被内推了这个岗位,还没投简历😢
1 回复 分享
发布于 2020-03-21 16:38
请问是战略分析类的数据分析吗
点赞 回复 分享
发布于 2020-03-20 19:57
你好,快手的笔试是3月22日开始的,请问你是没有做笔试,直接面试的吗?
点赞 回复 分享
发布于 2020-03-20 21:28
请问是暑期实习吗
点赞 回复 分享
发布于 2020-03-20 22:29
感谢楼主分享!我是统计学的,现在在算法实习😂,感觉秋招很有可能算法阵亡,所以还是选择算法和数分两手准备~秋招可以找楼主内推嘛?😁
点赞 回复 分享
发布于 2020-03-20 23:22
优秀
点赞 回复 分享
发布于 2020-03-21 01:39
还有内推链接么,想被内推😂
点赞 回复 分享
发布于 2020-03-21 09:53
老铁啥时候入职
点赞 回复 分享
发布于 2020-03-21 10:11
同学你的项目是机器学习的项目吗
点赞 回复 分享
发布于 2020-03-21 10:47
我也是计算机专业的,,问问同学你的数分项目是哪找的呢?什么类型才是数分项目呢?kaggle上的预测或者回归比赛算么?
点赞 回复 分享
发布于 2020-03-21 11:12
楼主请问python/sql,机器学习有好的网站或者渠道推荐吗?
点赞 回复 分享
发布于 2020-03-21 11:27
好多没掌握的。。还好转行了。。。
点赞 回复 分享
发布于 2020-03-21 11:29
真的很有用!谢谢楼主
点赞 回复 分享
发布于 2020-03-21 21:02
恭喜楼主顺利上岸!也感谢提供平台给大家分享~祝大家都能早日上岸!
点赞 回复 分享
发布于 2020-03-22 09:15
学长NB!
点赞 回复 分享
发布于 2020-03-22 23:16
恭喜楼主,顺便问下,三面到hr面要多久,还有后面背调时间多长呀
点赞 回复 分享
发布于 2020-03-22 23:25
请问面试邮件发的是【经营分析-数据分析】这个嘛
点赞 回复 分享
发布于 2020-03-23 10:58
想问一下现在才开始投实习简历会不会太晚了😭我醒悟的太迟了
点赞 回复 分享
发布于 2020-03-25 02:01
谢谢楼主分享!还想问一下您说的第一点python和sql要可以手动实现指标,请问有什么练习渠道吗😖我有做一些sql的习题,但是都是基础训练,不涉及业务,感觉和真正业务要写的情景差很远😢
点赞 回复 分享
发布于 2020-03-25 02:43
我也是跟你面同一个部门同一个组 之前问了hr说就两轮技术面 但是看了你的三面还是心好慌 周四leader面 感觉网上分享的人也比较少呜呜呜 想问下leader人好么 会不会很刁难人?
点赞 回复 分享
发布于 2020-04-14 01:04

相关推荐

36 422 评论
分享
牛客网
牛客企业服务