数据挖掘/数据研发面经分享

提前批招聘告一段落,在牛客网上泡了2个月,刷题刷论坛,也该写点东西回馈一下。ps:牛客的ios端有bug,点个帖子经常进入另一个帖子。
先说结果:华为云计算和阿里B2B数据研发面试通过,其他都挂了。
我的感觉是面试官喜不喜欢你很重要,如果喜欢你怎么不会都没关系,不喜欢你怎么会都有风险。很多东西我们在校生很难接触到,所以大多数面试官是从简历中问问题,再带一些开放式问题和计算机基础问题,但也有一些喜欢问他擅长的东西,而这些东西你可能根本就没接触过,也没法准备。
以下所有面试都以项目为主!面试题凭记忆,不一定全。
华为:云计算开发工程师。楼主是软赛32强,直通终面,面试官是东北老乡,聊的很好,没问技术,sp。想去华为的同学墙裂推荐华为的软件大赛,华为很土豪的说。

阿里:B2B数据研发工程师。共5面。4轮B2B的技术面,1轮淘系的交叉面,居然没有hr面!!!楼主有阿里大数据竞赛经历和阿里云算法竞赛经历。
数据库的ACID?常用操作?
操作系统中的死锁?
继承和多态?
并发编程?
SVM有哪些核函数?如何选择?
决策树算法?什么是熵?
随机森林算法?优缺点?
某竞赛,如果让你继续优化,你打算怎么做?开放题
对大数据怎么理解?
对数据研发岗位的理解?
职业规划?
对阿里产品中数据挖掘的应用的了解?
优缺点?
给你一项业务,你将如果开展工作?开放题

腾讯:微信一面后没消息。视频面。
逻辑回归算法?
在微信的场景下,如何判断用户的职业?开放问题
三道概率题:直接放知乎链接。
还有一道是这样的:一个国家重男轻女,只要生了女孩就继续生,直到生出男孩为止,问这个国家的男女比例?答案是1:1,思路是等比数列求极限,当时只答对了这道题。

网易:杭研数据挖掘工程师。笔试A了两道编程题,第三题有思路,时间不够了,三道都用的递归的解法。面试是在杭州现场面。
一面:印象最深刻的面试。似乎是压力面?后知后觉。自我介绍没说完就被打断,然后按时间顺序看项目,每次我说些什么,总是被打断。然后总结说我们实验室的项目偏理论,没有实际应用(这是对的,不过高校的项目大多不都是这样吗。。。)。然后竞赛就说阿里的大数据竞赛水平不如Kaggle,没什么技术含量(我承认,但是我是应届生啊亲,要求太高了吧)。另外两个算法竞赛就问问用了哪些算法,我说分支定界遗传算法Dij,他似乎没什么兴趣,说遗传算法很慢啊(慢吗?),我说迭代次数可以调。。。前方高能了,问了一道pandas的题,不会,问spring、web service、maven,不会,问count vectorizer,没用过,并发编程,没经验。。。感觉收到了1w点伤害,他让我问问题的时候,我都有点要崩溃了,不过还是厚着脸问了项目组的情况,问为什么问那么多研发的东西,面试官表示数据挖掘工程师大多数时候就是在搞研发。出来后感觉要跪,还好有二面的机会。
二面:面试官很nice,全程聊项目,说我的工作做的不错,详细讨论了样本采样和bagging的问题,通过。我还问面试官为什么一面面试官问很多研发的东西,面试官说他们搜索组不会有很多研发任务,最多就是搞个web service,看来不同组的差别真是大。
hr面:hr姐姐很nice,聊的不错。对数据挖掘岗位的理解?
附加几个小伙伴遇到的面试题:预测的评价指标有哪些?如何处理过拟合?推导逻辑回归?

蘑菇街:数据挖掘工程师,蘑菇街的面试最难,据说7000份简历50个hc。。。一面后挂掉
用分布式的方法做采样怎么保证采样结果完全符合预期?
L1正则为什么能让系数变为0?
L1正则怎么处理0点不可导的情形?(这个谁会?近端梯度下降)
看没看过scikit-learn源码LR的实现?(回头看了一下是调用的liblinear,囧)
附加几个小伙伴遇到的面试题:随机森林和GBDT的区别?LR的参数怎么求解?有没有最优解?

微店和滴滴研究院一直没消息。。。先写这么多

winter is coming

最后祝大家都能找到合适的工作~


#阿里巴巴##腾讯##网易##蘑菇街##算法工程师#
全部评论
赞赞赞,lz拿了几个offer了?
点赞 回复 分享
发布于 2016-09-02 12:32
赞  楼主觉得投算法岗一些计算机基础的东西需要补吗  比如计算机网络 操作系统什么的
点赞 回复 分享
发布于 2016-09-02 12:58
研究生吗
点赞 回复 分享
发布于 2016-09-02 14:43
进蘑菇街面试的就是大神
点赞 回复 分享
发布于 2016-09-02 21:18
参加过阿里大数据竞赛和kaggle,我觉得阿里的竞赛更难一些,kaggle现在变得有点套路了。
点赞 回复 分享
发布于 2016-09-02 21:52
lz的面筋。。。腾讯跟我一模一样。。。可是我下午面现在才看到
点赞 回复 分享
发布于 2016-09-02 22:05
楼主是大神啊!求带 哈哈哈哈
点赞 回复 分享
发布于 2016-09-02 22:18
蘑菇街这个***了……
点赞 回复 分享
发布于 2016-09-03 00:12
咨询一下LZ,阿里那个确认书,需要马上签吗?还是可以等到12.31以前再签?他那个确认书是什么意思?签完就三方了?不知道LZ有没有签,知不知道是怎么回事。
点赞 回复 分享
发布于 2016-09-03 06:50
L1正则的那个,是求子导数吗? = = 顺便问一下,好多公司的数据挖掘岗包含在算法岗里,面试的时候不出那种基本算法题吗…?比如DP啊字符串啊之类的。
点赞 回复 分享
发布于 2016-09-04 11:09
谢谢楼主分享。 我现在研二,研一做了kaggle的一个深度学习的比赛和学习了一些基本知识 现在怎么开始准备找实习。有什么书或者资源推荐吗?万分感谢
点赞 回复 分享
发布于 2016-09-28 11:45

相关推荐

11-09 12:17
清华大学 C++
out11Man:小丑罢了,不用理会
点赞 评论 收藏
分享
评论
31
236
分享
牛客网
牛客企业服务