【面试经历】2020春招实习面经
阿里新零售技术事业群-淘系技术部用户增长团队&C2M事业部-用户产品部:技术岗(邮箱、内推)
2月 简历挂
字节跳动 数据挖掘实习生 日常实习(官网、内推)
2月 简历挂
腾讯互娱IEG光子 数据挖掘/NLP岗(微信投递)暑期实习
一面 电话面 挂
28min
1 自我介绍,在校经历,主要研究方向
2 讲一下竞赛的过程?特征工程做了什么?
3 为什么用Xgboost?
4 除了Xgboost,其他常见的分类算法?
5 LR和SVM有什么不同?(提示不同的场景怎么用,没答上来)
6 SVM常见的核函数?
7 数据结构学过吗?(没。。)
8 常见的算法了解吗?讲一讲快排?
9 用过什么神经网络模型?RNN和LSTM了解吗?(不了解。。)
10 做过NLP项目吗?项目中是怎么做特征提取的?
面试官是NLP方向的,数据挖掘应用的场景较少,主要做NLP,比如文本分类等。面试官说基础还不错(行业黑话。。。),但是经验不足,建议多刷项目。
网易互娱 数据挖掘实习生(官网)[内推]暑期实习 一志愿
二志愿 数据分析实习生
4.11 笔试
20道单选 10道不定项 2道编程一道20%一道27%,找到问题但不会写。
美团点评 机器学习/数据挖掘算法工程师(官网、内推)暑期实习
3.12 笔试
统一赛马网笔试,五到编程题,2小时完成。除了第一道37%,其它全是0%,一道也没有AC…..
3.24 一面 视频面 挂
49min
1 先花点时间介绍一下自己,学习经历,实习经历,项目经历。
2 实习经历的工作内容是怎么样的?为什么之前不找互联网的技术岗实习?
3 LR的损失函数是什么?为什么不使用均方误差?
4 数据结构学过吗?二叉搜索树有什么性质?
5 二叉搜索树的查找时间成本?平均和最差情况?为什么?
6 反转二叉树,手写递归和迭代方法(c++不会,用python写的)。
7 不使用if-else和比较符号,怎么输出两个整数的最大值?手写。
8 FM和LR相比有什么好处和优点?
9 wide&Deep了解吗?讲一下原理。
10 tensorflow用过吗?
11 hadoop了解吗?
面试官是广告方向的,也是主要算收益和CTR的。这次的问题主要出在数据结构问题很大,简单题也没有写出来。第二个求最大值也花了很长时间,中间还断线了。。。
问了面试官三个问题,一个是偏技术还是偏业务,另一个是特征工程时间多还是模型结构优化时间多,最后一个是LR是否是很常用的模型。
字节跳动 算法实习生-业务研发(官网)暑期实习
原来日常实习内推挂了连春招都没有了,太惨了。
腾讯 技术研究-机器学习 暑期实习生(官网)暑期实习
应用研究
3.11 一面 视频面 挂
30min
1 实习时间、自我介绍
2 题外话,你们学数学的没有学前沿的机器学习方法,你是怎么自学的?
3 项目中有没有对特征作标准化?为什么不作?比如说LR的标准化的作用是什么?(提示andrew wu的机器学习课上有)
4 你说对数处理是为了符合正态分布,为什么要近似于正态分布?
5 介绍一下SVM
6 SVM和感知机有什么区别?(太难了,不会)
7 有没有看最新的外文文献了解新的机器学习模型?(没。。)
面试官是PCG的,base深圳,主要做广告方面,主要是NLP或CV方向。这次我问他业务能力怎么提升,面试官认为基础更重要,说明这次我的基础理论回答很差,还要继续补基础。
另外从这一次的面试和腾讯宣讲会来看,面试官考察项目经历并不是想知道你有多牛(实际上在面试官眼里可能就很菜),而是想要考察你的思维方式和逻辑,比如说问题3~4就是这样。
应用研究-数据平台部-广告推荐小组
4.8 一面 视频面
42 min
时隔一月竟然被捞,但是算法岗太难了,硬着头皮面。。。
简直屠杀现场,一问三不知,一点都不会。
算法岗是推荐系统算法的实践和落地,分析岗是对算法的分析,异常特征检测,特征重要性识别,也需要储备非常多算法知识。
1 实习时间?到底是选分析岗还是算法岗?
2 挑一个项目介绍。
3 特征工程部分做了什么事情?
4 你说进行时间平移,为什么?如果再做一遍,用另一种方法?
5 连续特征分桶,为什么这么做?用另一种方法?
6 连续变量之间的相关性怎么衡量?连续变量和类别变量呢?(tips:t检验,卡方检验)(这题本该和统计知识很相关,竟然还是没有想出来,还要提示。)
7 lag特征为什么选3天和72天?别人的24天是什么意思?
8 如何做特征选择?如何认为一个特征很重要?
9 基尼系数、信息增益、信息增益比是什么意思?
10 boosting方法和bagging方法的区别?boosting有什么优点?
11 C学过吗?C++的指针和引用有什么区别?
12 sql的大表join小表怎样做性能最好?(tips:union和union all的区别)
13 用过spark、scala吗?
14 python的range和xrange有什么区别?比如说我要循环10次,怎么写最好?
15 auc了解吗?roc曲线怎么画效率是最高的?
16 了解python的线程和多线程吗?
17 lambda不适用于什么情况?
18 熟悉linux吗?
这次的面试基本上都是问编程语言的性能分析,因为工作就是对算法的性能分析,基本上每一套语句都用到极致。Sql不能停留在只会写,还要多了解怎么写最优。Python还是写得太少了,面试官说14问就是想考察代码写得多不多,这一看就不多啊。。。
4.10 二面 电话面 挂
20 min
下午突然来电,啥准备都没有,非常紧张,话都说不清楚,杀了个措手不及。时长短基本没戏。
1 对实习的地点有要求吗?
2 介绍一下你的研究方向。(面试官很惊讶我还没开题….)
3 讲一讲你的项目。
4 为什么用xgboost模型?树模型不是用来作分类问题的吗?
5 xgboost调优做了什么?
6 有没有看过榜第一的人用的什么模型,工作怎么做的?
7 如果再做一遍,你会做什么改进?那你当时为什么不用LSTM模型?
8 实习主要是想做什么岗位?想学到什么东西?
9 你说想根据业务知识进行改进,那你的项目根据什么知识做了什么改进?
10 做这个项目是为了什么?
问题都是围绕着项目问的,虽然基本上都能回答上来,但估计并不是面试官想要听到的。事后想了一下,其实很多问题问的可能不是项目本身,而是要一般化(虽然我问面试官时,面试官是叫我就项目说的)。比如说4问,感觉就是要说说xgboost的优点。但是实在是太紧张了,来不及应变,这种经历太少了。
京东 数据挖掘实习生(官网???)
忘记在哪里投的了,完全没有信息。隔段时间回来看,发现投的是产品经理,又不知道是校招还是暑期实习,很懵。
京东数科 数据分析实习生(***)
网易云音乐 数据分析实习生(内推)暑期实习
笔试 挂
4道编程只a了一道。
美的 数据挖掘实习生(官网)暑期实习
4.22 一面
20min
1 自我介绍
2 项目的数据量多大?
3 (换人)讲一讲某个项目的预测目标是什么?数据量多大?每一行数据代表什么?
4 用了多少个特征?做了什么特征工程?
5 异常值处理剔除0值,是剔除特征还是剔除样本?
6 为什么要剔除0值?
7 类别不平衡怎么处理?
好短的面试。。。另外一个面试官还提醒面试官要注意时间。。
部门是美的金融,有两条业务线,一条主要做信贷、风险建模等;另一条是资金管理;面试官说也会用到一些文本分析,RF模型等。
腾讯 软件开发-数据分析 暑期实习生(官网)
挂了之后转投的,但是没有被数据捞,又被算法捞了起来。。
4.26 常规批笔试
5道编程a一道
微信安全团队 数据分析(邮箱)日常实习 or 腾讯 创新项目增长中心数据分析实习生(邮箱)日常实习
以上这两个分不清楚哪跟哪,都是中山大学公费电话打过来的。一个让我在线笔试,一个问我有没有报暑期实习。后者可能是日常实习的内容,听到我倾向暑期实习就先挂了。
华为 产品数据工程师(官网)暑期实习
4.8 笔试
和腾讯面试冲突了,能写多少写多少吧。。
一个多小时80%,20%,0%,太菜了。
4.21 一面 挂
40min
1 自我介绍(项目都没问,我自己强行说的)。
2 在学校学了什么知识?
3 学过什么面向对象的语言?用过什么数据库?
4 你搭建得了hive的环境吗?
5 数据库增删改了解吗?你说说怎么给表插入值?
6 (换人)学过什么数据库语言?说说你理解的什么是数据?(事实或观察的结果。)
7 mysql怎么建表?
8 散点图有什么用?正态分布图有什么用?
9 怎么理解数据质量?
10 什么是第三范式?
11 (再换人) 两道python,输出99乘法表;输出1000以内的armstrong数。(全部暴力解决的,以为还会问怎么优化)
最后竟然没有反问环节,因为我真的很想知道这个岗位是做什么的。这次面试看起来好像很简单,但问的问题我没有能够完整答出来的。面试官也都困了,就算积累经验吧。
斗鱼 数据挖掘实习生(官网)暑期实习
简历 挂
京东 数据分析工程师(官网投递)暑期实习
4.18 笔试
30到选择题,2道编程,一27%一0%
4.23 一面
38 min 挂
1 自我介绍
2 详细讲讲两个项目做了什么工作?
3 word2vec的原理是什么?
4 过拟合是什么?如何解决过拟合问题?
5 l1和l2正则化有什么不同?
6 了解python的gc底层原理吗?
7 手撕:最大连续子向量和
面试官是广告推荐的,主要是机器学习方面的,不知道为什么数据分析岗被分到了这边。。他说数据分析主要都是做大数据分析的,如果有二面,二面面试官应该会讲清楚。
阿里 数据分析师 暑期实习生(官网)
4.24 一面 电话面 挂
30min
1 自我介绍
2 挑一个项目细讲
3 做了什么工作使得指标上升显著?
4 排行榜前十名的人做了什么工作,你从中学到了什么?
5 讲讲实习经历。
6 为什么实习和专业不太相关?为什么不找其他实习?
我发现电话面比视频面紧张很多。反问了面试官机器学习是否相关的问题,面试官回答说使用机器学习不多。声音太嘈杂了,什么都听不清楚。说的话也语无伦次。
微众银行 数据分析 暑期实习 (官网)
快手 数据分析 暑期实习生 (官网)
4.12 笔试 挂
3道sql,2道数据科学题(写python/r),第一题是求roc和auc,第二题是验证中心极限定理。
360 未来安全研究院-数据分析师 暑期实习生(官网)
笔试
竟然是综合卷,考性格测试。。。
携程 大数据分析师 留用实习(官网)
笔试
3道sql全a了。
4.29 一面 33min
1 自我介绍,挑一个项目说
2 xgboost、随机森林、gbdt有什么不同?
3 xgboost的并行怎么理解?
4 xgboost怎么处理缺失值?
5 cart回归树和分类树有什么不同?
6 xgboost和随机森林的叶子权重是怎么计算出来的?
7 用过最多的词向量方法是什么?
8 在现实中,怎么解决训练词向量的训练难度大问题?你的词向量是怎么来的?
9 如果一个分类器auc是0.5,你从哪几个方面去优化?auc是什么?
10 为什么选携程?项目都是挖掘经历,怎么会选数据分析?
11 场景题:跟团游产品推荐,怎么提高用户购买?(tips:实际上是人货匹配问题,就是二分类问题)
面试官最后一题给我解答了很多:主要考虑用户特征(收入、教育、地区、年龄等),货物特征(这里是产品特征),上下文特征(context,如最近的行为信息,度蜜月还是毕业旅行等),最重要的是人-货交叉特征!
问了面试官两个问题,是不是偏业务和偏技术都有,面试官答主要都是为了业务;第二个问的是工作内容,面试官说主要制定出一个产品策略(就是最后一问的工作)即可,剩余的让工程方面的同学解决。
5.15 二面 20min
1 自我介绍
2 业务题:如何检测转化率异常?
3 决策树的特征选择的标准是什么?为什么有信息增益还要信息增益比?
4 了解什么机器学习方法?
5 极大似然方法是什么?为什么要极大似然?
6 怎么比较分类方法的效果?
7 了解集成方法吗?
8 如何提高模型的泛化能力?
9 你知道的降维方法有哪些?
5.20 hr面 19min
Vivo 数据分析经理-21届实习(官网)
简历 挂
欢聚时代 数据分析实习生(官网)
简历 挂
小米 大数据开发工程师
简历 挂
富途 数据分析 暑期实习生(官网)
4.8 笔试
和华为笔试,腾讯面试统统冲突了,没参加。
4.11 改到了周六笔试 挂
20道选择很多不会的,4道填空也差不多,1道程序题只能用c++和java。。。。是0交换排序问题。
欢聚集团 校招提前批-数据分析实习生
简历 挂