一个小硕的面筋回报帖
去年从实习到秋招牛客网上的小伙伴给了我很多帮助,那些每天苦等offer的日子都是在刷牛客网度过的。
个人不是很喜欢写博客记录的人,不过最近和学弟聊起来发现自己的经历还是有一点价值的,写出来假如对大家有一丝丝的帮助,也是对我最大的褒奖啦
个人情况说明:
19届,女生,双985,学硕,算法/机器学习/数据挖掘方向,意向杭州工作所以面的不多
实习拿到了京东,阿里,秋招拿到了OPPO, 网易,阿里
最后去了阿里
以下按时间记录的面试:
阿里一面:(天猫)四十多分钟
自我介绍
讲参加的两个比赛(模型和特征工程)
根据xgboost/lgb等解释boosting的思想
智力题:
学校男生的概率2/3,女生的概率1/3,男生穿牛仔的概率2/3,女生穿牛仔的概率1/3,你看到一个穿牛仔的,问他是男生的概率是?
有公共节点的链表怎么找到第一个公共节点
六边形,顶点上各有6只毛毛虫,可以沿着边走,两个毛毛虫相遇的概率,n边形呢
提问
腾讯一面:(腾讯视频)四十多分钟
没有自我介绍!
听说你熟悉Linux?栈溢出导致程序跑飞了是怎么回事??
命令行会吗?那***命令是干啥的你知道吧?不知道。那***命令是干啥的你知道吗?。。。不知道。。。
那听说你做过网络管理员,命令你都不知道吗?现在网络管理员这么好当的吗?。。。心态已经崩了,,,
讲讲文本分类cnn跟rnn吧,为什么使用这些,卷积提取的到底是什么,最大池化是不是导致了信息丢失,rnn为什么可以用于文本分类?原理是什么,word2vec作用在哪里?你的网络如何区分短文本,脏数据文本,比如同时存在唐诗李白和王者荣耀李白怎么分类,怎么确定它的分类。
挑一个最能体现你能力的项目?推荐大赛,比赛数据存在问题。
提问
阿里二面:48分钟
纯项目
两个比赛,特征工程,模型融合的处理
阿里三面:交叉面 一个小时
项目(文本分类讨论了很久很久很久),不过感觉面试官很棒的,还给了很多思路,看的出来水平很高,看问题很准
然后最后问了两个编程题:
1.f(n) = f(n-1)+f(n-2)+f(n-3)
2.假如一个数组存储了一个股票,在一天交易窗口内各时间点的股票价格(正整数),只允许一次买入和一次卖出,请提供一个算法,计算出通过买入和卖出可以得到的最大利润
腾讯 社交网络事业群一面 一个小时
最能体现你能力的项目 推荐(假如给你更多的信息,你如何构建模型)和文本分类,
项目中讲一个熟悉的算法:word2vec
假如你有用户的社交关系信息,如何利用来改进推荐效果?多说几种。
假如一个算法,内部觉得很好,但是实际上线效果不好,为什么?
学了哪些课程?微积分,那微积分基本定理是什么?讲一下堆
大疆 四十多分钟
讲了之前做的一个推荐比赛,和文本分类工作,但是听他介绍那边的工作是偏工程,做数据标注系统的,觉得兴趣不大所以拒绝了
腾讯二面 36分钟
学过哪些课程,与机器学习相关的课程,对哪些算法比较熟悉,那你推倒下svm, 解决svm过拟合的方法,讲文本分类,为什么残差能解决梯度弥散和梯度消失的问题,你在实验过程中有什么技巧,你有什么问题。
小米一面:智能云平台
图片检测和识别的内容(faster-rcnn)
讲文本分类项目
过拟合是什么情况,怎么解决,每种方法的原理。
第一范数和第二范数的意义和作用
你有什么问题
小米二面:智能云平台
非常详细的讨论了文本分类网络的结构,每一层处理之后的维度
编程题,数组中和为k的数对。先说了o(nlogn)的方法,然后要求o(n)的解法,可以牺牲空间复杂度
链表中的环
restful API 的含义
你有什么问题
京东一面 38分钟 微信京东入口 深圳 4.20
讲文本分类的项目,卷积操作
讲达观推荐算法大赛
场景:有用户feed流和点击信息,如何做推荐
15个硬币,两个人轮流拿,1-3个,最后一个拿到的输,有没有必胜的方法
5l 和3l的两个水桶,量出4l的水
Linux更改文件权限的,那改可执行的是多少?777?详细解释下
查看文件前十行
场景:每天的用户,商品,销量订单记录,求销量前10的商品,用SQL或者什么编程语言写一下?
你有什么问题
京东二面 20分钟 4.21
讲达观推荐算法大赛
个性化推荐有哪些方法,具体怎么处理
你觉得算法工程师需要哪些素质和能力
京东hr 4.23
非常虚,什么怎么带团队啥的,个人优缺点啥的
网易游戏雷火一面 4.26
- 27个球,有一个轻的,找出来最少需要几次?
- 问三个囚犯一碗汤, 每次都分的不均不开心,设计分法让大家都满意
- 数组有n个整数,每次对n-1个数全部加1,求最少几次让所有的数相等
- 编程题,求数组的最长子集,整个子集满足所有的元素两两模除为0
讲项目
你有什么问题
网易游戏真的,周围人都跪在智力题上。。。
以上是我的部分面筋,多的我也忘了,当时拿到了心怡offer之后就没再认真记录了,,,可以说是非常浮躁惹哈哈哈
当时除了以前做的比赛和研究工作,每天就是刷剑指 offer了和各种知识点的小博客了,都是对以前零碎知识点的回顾和梳理,觉得还是挺充实的,相比现在==|
心态也有崩的时候,做笔试做到崩溃也哭过一场,不过都过来啦,慢慢来,总会有offer砸中自己得啦!!!加油!!!
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
以下是一起找算法工作的朋友的面筋,经过他的同意也拿来跟大家分享下,他是拿了bat大满贯的人,我是服的!!!
2018年3月14号 京东 算法工程师 内推
一面:
操作系统:死锁的条件、死锁避免方法、银行家算法;
计算机网络:OSI七层网络结构,四次挥手的等待时间,TCP和UDP的区别
linux系统:强制杀死某个进程的命令、其他的命令
数据库:mysql的引擎、事务的特性
机器学习:LR和SVM区别,SVM损失函数,LSTM原理
大数据:熟悉不熟悉spark? 平时怎么管理和调度GPU资源的?
编程:数据库找第二大的数字sql语句、求N!的二进制表示中最低位1的位置、写个快排、多个字符串组成最大的数
2018年3月15日 京东 算法工程师 内推
二面:
问GMM算法?
问最小的K个数?
rand1()生成rand5()?
其他的忘记了?就是问项目很算法
TX面经
2018年3月18号 腾讯技术一面 内推
1、自我介绍,说了本科就学了很多相关课程,然后有对机器学习算法很强的兴趣;
2、问本科专业和计算机专业有哪些区别,专业主要是学什么,必修选修;
3、问项目,然后聊里面的算法,解释两个最熟悉的机器学习算法,聊项目里面的特征怎么处理的,聊为什么用这些机器学习方法去做,样本不均衡的话怎么处理;
4、聊学过哪些机器学习课程:机器学习、模式识别、计算机视觉、人工智能;
5、问关于最优化接触过的课程:人工智能、科学计算方法;
6、问牛顿法怎么求解,我说忘记了;
7、最后问怎么解决过拟合的?我结合着之前的课程实验、做的项目把各个机器学习算法里面基本上所有过拟合方法提了。
2018年3月19号 腾讯技术二面 内推
1、问了实验室方向,所做的事情?实验室的毕业生一般去哪工资?
2、实习允许么?问不是一般放假一个月两个月的么?
3、问了舰艇自适应决策系统,项目需求、怎么做的,为什么选择LSTM?
4、要写论文么?是实验室强制的么?
5、了解阿尔法狗么?
6、熟悉哪些机器学习算法?
7、决策树有哪些选择最优划分节点的方法?有了信息增益为什么还提出了增益比?
8、模型评价标准,RMSE\ROC\AUC等等
9、平时一般用什么做工程、用什么做算法?喜欢工程一些还是算法理论研究?
10、QT和python怎么结合?
11、C++实现多态的好处,有哪些实现多态的方法?
12、了解推荐算法么?举例说明一般个性化推荐怎么做的?
13、你有什么问题?
2018年4月8号 腾讯技术三面 内推
1、问了实验室的方向,硕士生和博士生都做什么,实验室毕业生有多少?
2、实验室要求不要求发论文?打算在哪方面做研究?举个例子说明想法。我就说了看CVPR上面少量样本学习的那篇文章里面的一些想法。
3、专利内容是什么?并详细了解了空调备件数量分析预测系统的过程。尤其是为什么选择分类后回归,以及几种回归算法的原理及选择依据。
4、还熟悉哪些机器学习算法?我回答了决策树、聚类、神经网络、深度学习等等。
5、问那你说说决策树分类和回归时候有哪些区别?我说不知道。说了常用分类的过程。
6、了解阿尔法狗的原理么?我说决策网络、价值网络和蒙特卡洛搜索树以及他们的作用等,还有一些记不太清了。
7、了解最近提出的胶囊网络么?我说最近在忙着准备项目中期,所以在科研动态方面关注的比较滞后。
8、对推荐算法有了解么?我说了一些常用的协同滤波,基于人和基于物品的推荐原理,然后自己之前试过SVD做一个简单的推荐。他追问,为什么做这个呢?我说当时看书比较感兴趣,就照着试验了一下。
9、分类模型评价标准有哪些?我说有准确率、ROC\AUC、RMSE等。追问,AUC可以用于多分类模型么?我说不行吧,一般都是针对二分类问题。现在想想应该可以,把多分类改为多个二分类应该就行了啊。
10、看过哪些相关的书籍?我说机器学习实战、统计学习方法、西瓜书、tensorflow实战等等。
11、学习过哪些机器学习课程?我说CS231n,网易云上面的深度学习
12、平时用什么语言?我一般做算法用python,做工程用C++。追问你用python主要是用scikit-learn库么?我说有的是用了,有的要自己写,比如GMR,RBF,还有的用tensorflow的深度学习框架。
13、你说说C++多态的好处?我说多态便于封装,约定接口,一般多态是通过虚函数和重装。
14、纯虚函数的用处?不知道
15、虚函数的好处?忘记了
16、C++类里面有一个静态成员,那么有什么特性?我结合着我项目怎么实现单例模式的进行说明,成员的唯一性,类的所有对象共同访问。
17、哪里人?河南信阳的。
18、做过笔试么?做过。觉得考的怎么样?我说因为里面很多都是数学基础题目,所以像有些假设检验相关的内容因为时间太久了都忘记了,大部分做的还行吧。
19、最后说两个月的实习有点短啊,我解释了华科的问题,不让出去实习,实验室允许请假一个月才有两个月的机会。7、8月么?是的。
2018年4月15日 武汉 应用研究现场一面
1、实验室方向是做什么的?
2、python交换数字a,b
3、python对一个列表删除所有为0的数字
4、python怎么定义一个类的成员变量
5、linux怎么删除一个进程?那么进程号怎么知道呢?(grep)
6、linux命令怎么查看硬盘太小
7、LR和SVM的区别,当聊到损失函数,问分别是什么?hinge损失函数里面的z是什么?
8、决策树里面的分类树怎么选择划分属性,给了两个属性分布情况,问选择哪个?
9、决策树做回归时候划分点怎么选择?
10、LSTM对于RNN的改进地方在哪?解决了RNN的什么问题?(梯度弥散)
11、那么RNN的梯度爆炸怎么解决?我回答能想到的就是relu函数,他不满意,说有没有通用的方法,回来查了还有正交权重矩阵等等。
12、LSTM的结构,里面的遗忘门是一个数值还是向量?维度是多少?
13、python写一个函数,实现给定一个列表,把列表所有0移到列表最后面,其余相对顺序不变,要求时间o(n),空间o(1)
14、python写一个函数,实现有1T 的数据,10亿个不重复单词,给你一台机器,16G的内存和5T的内存,怎么统计每个单词的个数?
15、补充一个还有LSTM你用的优化方法是哪个,我说是Adam,他问还有哪些,我说SGD等等,他问GD和SGD的区别了
2018年4月17日 武汉 应用研究现场二面
1、不打算读博么?
2、能够实习几个月?
3、为什么用到LSTM?
4、解释一下AUC(ROC的面积),从概率上面的解释一下(这个不会)?
5、解释一下交叉熵(我说了他的函数形式),举个例子(举不出来)
6、解释梯度消失和梯度爆炸问题,然后怎么避免?(这个我结合RNN回答,完整回答的问题之一)
7、解释一下模型训练里面的偏差和方差对于训练的意义?(回答感觉还行,算是回答上来了吧)
8、用了gcc没?答用的比较少
9、用过python没?用了,zip作用,说打包,问举例具体一点?不知道。numpy里面的list的引号是什么意思?不知道问的是啥。
10、自己在学习中比较高兴是什么时候?
11、有没有关注最新科学界动态?关注了一些,讲了一篇CVPR2018的文章
12、你有没有什么问题?我问您是哪个部门的?数据平台部。(内推面了三轮了的。。。)
13、收好你的简历和物品,结束。
2018年4月19日 武汉 应用研究现场HR面
1、专业属于哪个学院?计算机还是软件?
2、家在哪?家里面还有没有兄弟姐妹?
3、还面了其他的公司么?
4、主要熟悉的是tensorflow是吧?
5、为什么没有看见论文呢?之前没有计划发是吧?(现在实验室有要求了,所以计划研究发,然后专利在审核中)
6、平时怎么学习机器学习算法的?(大学就开始学过课程,看过MIT,斯坦福公开课,还会看csdn、看最近的论文)
7、保研到华科是是吧?(保研的)
8、没有考虑做竞赛么?说了目前在做算法比赛
9、有什么问题:
问1:前面面试官对我的评价
答:说了很多,大概就是基础还行,但是网络模型调优要加强,因为面试考察基础,业务上面可以后面再培养
问2:实习生培养,去了之后做什么?
答:跟小组有关,一般有用户画像、文本分析、推荐等业务,去了会再分组,到时候应该会通知提前准备