数据挖掘算法工程师面经
数据挖掘算法工程师面经
走到现在,校招已经过了一半,自己心仪的公司也基本都走完了校招流程,我的校招随之已经结束了,在家中陪着父母过一个长假。闲下来,想远离代码,远离算法,好好的放松下自己,假期后要开始论文的征程了。找个空闲,给那些正在奋斗找工作的同学们和学弟学妹们,一点参考。
先来介绍下我吧,某211大学渣本硕,中间出去工作过两年,从事的行业与现在无关,可忽略。所有算法和编程都是入学以后学的,专硕,两年,现已过一年,寻找工作中,现已定去向。
我主要是算法方向,专业是统计学,可能我们更偏向于算法的优化,而在计算机的数据结构优化方面没有很深的理解。其中学习了java,python基本语言,算法方面主要是机器学习算法,深度学习有所了解,工程能力方面还有JS,CSS等web知识,MySQL数据库,Linux操作系统以及最重要的数据结构。优点就是爱刷算法题,笔试没啥问题。
春招时候,也是实习生招聘的时候,怀着远大的抱负,所有互联网行业全部被PASS。其中收到面试只有腾讯,阿里,头条,但都只是一面PASS。由此可见,算法功底还是不够,毕竟才学了半年。
通过实习僧,先后在中科院和平安科技实习4个月左右,特别是在平安科技,感觉提升很大,从一个只会写编程题的低等猿,到了一个可以一天写几百行的中等猿,可以独立完成一个算法,从数据处理,特征提取到模型建立,评判模型等都可以写。从此就走上了码农的道路。
到重点了!!!前面都是铺垫。通过各种关系,在这里要感谢很多大佬,首先就是威哥帮我内推了10家以上,还有百度爷路子,腾讯大佬飞飞还有360师姐等的内推,不管内推结果如何,很感谢大家。拿下的内推只有360,好未来和拼多多。校招批,拿下了三个面试机会,分别是搜狗,百度,苏宁。前面的铺垫是有必要的,因为那些被一面pass的公司都没给我面试机会,不知为何,华为简历都没过。
6个面试,3个offer:
1、360安全研究院数据挖掘工程师。(一面视频面 70分钟 gg)
自我介绍
项目介绍(数据预处理,特征选择方法,xgboost与GBDT区别(算法到内存),评价指标有哪些,项目上没上线)
朴素贝叶斯推导,优缺点
决策树(ID3,C4.5,CART)原理,信息增益公式推导,信息增益比的引入原因,Gini指数的用途和原理
随机森林原理,优缺点
随机森林与GBDT
Adaboost原理
Logistic回归推导,损失函数,优缺点
SVM推导,损失函数,优缺点
Kmeans聚类原理,k值的确定方法,优缺点
算法题1:一个数组找寻某个数(二分法)
算法题2:双向链表什么什么的(不懂)
你有什么问题需要问我的吗?(我只有一个问题,贵部门主要是做什么的,我进去我的岗位大概会是什么?)
总结:很专业很正式的一场面试,感觉到了强大的技术压力,第一个面试,让我简直快要放弃这个岗位了。但是很佩服,基础好扎实。
2、好未来数据挖掘机器学习工程师(一面17分钟 二面16分钟 都视频面offer)
一面:
自我介绍
项目介绍(。。。与上面差不多,就是没有问xgboost与GBDT区别)
你做过的项目中你比较熟悉什么算法,介绍下
开发方面接触多吗?看你会java
尬聊ing。。。
你有什么问题需要问我吗?(第一次回答,没有。。。)
总结:以为没有二面,但是过了4天接到了二面,二面在3天后。。。
二面:
自我介绍
项目介绍(。。。跟一面一样,不过问了好几个数据处理上的细节,有点专业,幸好我都懂,应付的过来)
RF的原理
还会其他的机器学习算法吗
我来介绍下我们部门的工作内容(balabala,说了5分钟。。。)
你有什么要问我的吗?(我心想,你都把我问题已经自己说完了,我有啥问题。。。)
那我接下来还有一个面试,就这样吧,具体的通知Hr会跟你联系。。。
总结:速战速决型。。。没想到就这样拿了一个提前批次offer
3、拼多多数据挖掘工程师(一面电话面 15分钟 gg)
自我介绍
项目介绍(一模一样的问题,问了几个核心的点,胸有成竹的答上来了)
RF原理,优化目标是什么!!!!!!(这个问题,我现在还没弄懂)
Kmeans聚类原理
朴素贝叶斯原理
决策树简介
了解推荐算法吗?给我介绍下这些算法怎么实现的?(懂是懂点。。。问题是没有做过相关的实现呀,懵逼ing)
算法题:如何层次遍历二叉树(据说用队列保存,遍历。。。没回答上来)
接着给我解释了下,然后就说今天的面试到此结束,再见!!!连让我问问题这个环节都没有了。。。gg
4、搜狗搜索事业部数据挖掘(一面二面+HR面 100分钟+40分钟 offer 已签)
一面+二面(面试我的直接就是主管,所以他说一面完,可以直接二面)
9点面试,8点半就到了,正好赶上主管去吃早饭,随口叫了我,正好我在,然后不吃饭拉我上去面试,真的很感动。大哥很和蔼,北方人。
进去后,直接说我先自我介绍下,然后就介绍了自己的部门,所做的事情,公司发展现状,这个岗位是干嘛的
自我介绍
项目介绍(互聊,感觉就是聊天的性质,很专业,每个点都问了一遍,四个项目,从背景到应用,聊到尴尬的地方就笑笑,对我工作两年的内容也很感兴趣,聊了很多工作内容,大概用了40分钟吧)
开始上技术了。。。
SVM的原理,推导,核函数的***
调参的方法,方式
模型的选择原理
朴素贝叶斯可以做多分类吗?
RF原理
GBDT原理
对比两个的优缺点
过关了!!!我打了一个预防针,数据结构不怎么扎实,所以算法题给的没有牵扯到树,指针这类的。
算法题:一个矩阵,每一行,每一列数值都是递增的,寻找第k大的数
然后我就哗啦哗啦的写了一面的java代码,因为他说偏开发,最好以后多用java写,然后就给他秀了一波java。他说要看我代码风格。。。
接着问我框架懂不懂,多线程,异常抛出这些基础会不会。我说我就框架不会,其他的都学过,但是马上说了这个学起来不难,有算法的功底,很快就入手的。
回归到了机器学习,他问我python做数据挖掘没问题吧?我就实话实说了,numpy,pandas这些都用烂了,独立写一个算法从数据处理到模型建立都没问题,他就说其实不会数据结构也没啥,在数据处理和算法这块也用不上,效率不会在这优化。行吧,你还差一点点就能说服我,只要你说服了我,我就下去带你去见HR。。。
又来聊天了,聊当今互联网的发展,搜索的发展,反正就是侃。。。OK,走,见HR
总结:运气真好,碰到了一个这么和蔼的大哥,总之,感觉时间过得很快,很舒服的感觉。
HR面:
学历,职位,课程,参加了什么活动,班级排名
后不后悔考研只考了个211
对你影响最大的人是谁
工作期间内容是什么
期待薪资多少
有哪些offer
Ofo和摩拜,你更看好哪个
你有什么问题要问我的?
没了。。。等通知吧,9月底给答复
总结:反正就是聊天,也不知道筛不筛选,反正就是侃侃侃。
5、百度机器学习(一面 45分钟 gg)
自我介绍
算法题开始(我反问了句,要不要我们先聊聊项目,或者机器学习算法,面试官回了句,这是一面,面基础,面数据结构,二面才面算法)
第一题:一个堆,怎么按顺序改为一个双向链表(gg,根本不懂)
第二题:一个无序数组,用时间复杂最低的来寻找某两个数加起来等于一个固定的值m,输出这些对(完成的还行,就是申请空间过大)
面试到此结束。。。gg
6、苏宁云商算法工程师(面试 12分钟 offer)
自我介绍
项目介绍(里面问到了异常值处理,评价指标等)
挑选你最熟悉的算法介绍下
RF与决策树的对比(无语的问题。。。我反问了句,这就是父子的关系,会有啥对比的,估计他也意思到问错,所以马上换问题了)
RF与GBDT的区别(balabala,讲了7点,把他完全说服了,估计有些他都没听过)
现在手上有什么offer
班级排名多少
你还有什么问题?(老问题)
总结:这速度,还只有一面,简直了,预料到会过的,感觉他们得基础还没我好,嘿嘿,自恋一会,就这样拿到了第三个offer。
说到这里,也把我所有的面试全部说了一遍,可能因为个人能力加学校,很多好的公司都没给面试机会。所以我在这里建议学弟学妹们,在你们还有一年或者多年准备的时候,岗位也和我一样的话,我建议多搞几个竞赛,这样的话在简历筛选方面会更有优势。还有就是运气也是实力的一部分。
Offer选择,我也甚是纠结,既然做了决定,就这样吧。祝福还在校招的同学们,加油,一定会有自己心仪的公司的,祝福学弟学妹们,明年能更上一层楼!
#搜狗##算法工程师#