百度 数据挖掘/机器学习 连续三面
从上午9点一路面到12点,从毫不抱希望到充满希望,反馈牛客网,求过百度!!!
一面50min--------------------
面试官是个幽默又可爱的小哥哥,面试体验感非常好
主要内容:因为我有两个项目都是NER相关的,所以主要是我介绍我的项目工作
期间面试官的一些问题:1.HMM和CRF区别?(因为我不了解HMM,就讲了CRF的原理),2.RF和GBDT,XGBOOST的区别?然后就是一个算法题:给两个字符串,可以对其中一个字符串进行增删移动添加操作求将其中一个字符串转变成另一个字符串的最小操作步骤,然后面试官直接告诉我通过,让我等下一轮
二面50min-------------------
二面面试官也是一个幽默又温和的小哥哥
首先,自我介绍之后,深挖项目,突然觉得有两个相关项目还挺好,问的时间都还挺长
然后就是一些基本问题:crf损失函数?过拟合怎么解决?正则化项有哪些,作用分别是什么?谱聚类算法实现,切图方式?哎呀,就一些基本问题,其他的脑子确实太满了,想不起来了
最后就是一个编程题:旋转矩阵二分查找(要求时间复杂度是log(n)),菜鸡的我控制不了时间复杂度,然后就让直接写普通二分
反问,然后就说让我不要离开,马上下一轮
三面40min------------------
二面完了直接连三面,水都没来得及喝一口,最后感觉说话都沙哑了
三面面试官是个比较严肃的小哥哥,但是温度 问题比较偏逻辑性
首先简单自我介绍,然后问了一些项目相关内容
然后就是一些我感觉比较偏数学的问题:模型优化方法(梯度下降?还有呢?不知道)?l1正则化和l2正则化分别加了什么先验条件?(拉普拉斯分布和正态分布),L1和L2适用于什么场景,具体怎样实现的呢?SVM损失函数怎样求解的呢,可以用梯度下降法求解吗?梯度下降法求解适合用于什么场景?过拟合的欠拟合介绍,怎样解决过拟合?
最后是一道概率+算法问题:给N个绳子,每次取两个端点打结在一起,求最终绳子打结的期望(先用数学公式描述,再用代码描述)
技术面试环节完了,面试官又问了可以入职时间以及实习时长,反问环节
面试官说最后结果会在一到两周内通知
至此,我的百度三面完成,消耗量真的太大了!!!大家面试一定要提前多吃一些!!!牛客网许愿,早日拿到百度offer!!!小伙伴们继续加油冲啊!!!