收到微软、腾讯、京东、百度实习offer,字节跪
2020.11面试更新
距离上一次更新已经一年时间,经历了疫情期间从CV转换研究方向到推荐和自然语言处理相关的两个比赛(腾讯广告算法大赛和华为DIGIX点击率预估名次都在前排),从十一月初开始面试找相关的实习,这里做一个记录,以便以后查看总结。
我去年也被腾讯挂过两次,凉经在这里😑,从小公司也是慢慢爬上来,有同学想交流的可以关注我的CSDN或者添加我的个人微信sunlanchang999交流面试笔试等经验,大家多交流一起进步,冲!
个人情况北京邮电大学硕士在读、两个竞赛拿到前排,有一段CV实习经历,一篇水文在投,总共面试了微软、腾讯、字节、京东、百度五家大厂的实习算法岗,最终拿到了微软的推荐广告算法offer、腾讯的自然语言处理算法岗offer、京东的搜索算法岗offer、百度的自然语言处理算法岗offer,字节三面跪了,最终选择了微软。接下来介绍面试过程,最后总结一下面试的经验也是最重要的收获💪。
总体来说面试的过程大同小异(除了微软),先介绍项目比赛,大概要四十分钟时间,最后留下20分钟时间A4纸code,远程面试的话要共享屏幕code或者在线网站code。一般大厂都有两面,一面表现好会直接二面,总共需要两个小时时间。字节有连续三面(还是比较严格的),微软更甚有四面!微软先有个一面过一天会连续三面,对项目理解和code能力要求都比较高👽。
面试问题总结
面试过去一周了,记不清楚每一次面试具体问什么了,我就把所有问到的问题写在这里了,当然这都是一些基本问题,中间其实有大量的开放问题,比如怎么减小Transformer时间复杂度和空间复杂度,如何准确匹配两个相同型号的产品等等,我在这里写下一部分题目,供小伙伴们参考👀。
- Transformer整体结构的介绍分为哪几层?这几个Transformer问题参考我这里的总结
- position embedding和word embedding为什么可以加起来,加起来的动机是什么?
- Self Attention怎么做的矩阵乘法?为什么除以根号dk?softmax是对哪个维度做的?如何做的seperate head?
- 为什么要用Layer Norm不用Batch Norm?Batch Norm是怎么做的?你还知道哪些Norm方式?
- Bagging和Boosting方式有什么区别?几个集成学习的为题参考
- XGboost、LightGBM、Catboost区别在哪里?各有什么优缺点?XGBoost和传统的GBDT有什么改进?
- XGBoost的正则项是什么?并行在哪里做的?
- TF-IDF的设计的思想是什么?公式是什么?
- word2vec的skip-gram和CBOW介绍一下,介绍负采样解决的问题,以及怎么进行负采样?word2vec ELMO GPT Bert的继承关系?参考我这个总结
- LSTM公式写一下,画出门结构看一看。参考LSTm输入输出
- 为什么用Dropout?Dropout本质是什么?
- 介绍一下Target Encoding
- 如何构造的二阶交叉特征?
- 如何判断构造的二阶交叉特征是有效的还是噪声?
- 介绍一下DeepFM、DCN、NFM,还知道其他的排序模型么?
- 如何解决的样本不平衡问题?采样比是多少?
- Focal loss要解决什么问题?如何解决的?写一下公式吧
- ROC曲线相比于PR曲线为什么能对数据不平衡更加鲁棒?
- 如何解决模型欠拟合问题?如何解决模型过拟合?
- 为什么L1使得模型更加的稀疏?用数学推导和图示两种方法解释一下。
- 介绍一下FCOS目标检测模型,如何加入的Attention机制?
- 写一下Momentum、RMSprop、AdaGrad、Adam更新公式吧参考我这个总结主要是Ng的课件
- ....
- ....
教训与经验
自己简历上的比赛和项目细节要非常的熟悉,如果自己做过的项目和比赛自己都说不明白,那面试官会认为你最熟悉的都说不清楚更不用说其他的了。其实我的理解是大家忘了以前做过的项目比赛细节情有可原,毕竟我也是忘了好多,但是忘了你不去复习看文档看细节这就是你的不对了,这其实也对自己提出了新的要求,以后再做项目比赛多写写文档,多总结,别写完代码就溜了💩。
算法题目还得继续练,我在大学有一段ACM经历,虽然没有拿到奖牌,但是做算法题的习惯保留下来了,面试国内一般的大厂还是能够拿下,有时候面试LeetCode medium还是不流畅,面试是一个交流的过程,不是说我问一个问题,你给出标准答案,不会的可以让面试官给个提示,面试官要的是想出思路的过程,第一次可能时间复杂度并不那么好,特别是微软上来就是算法题,有一次我也做不出来啊,我就厚着脸皮让面试官给点提示,也顺利通过了,做一些算法题这个习惯还得继续,不能停😈。
#实习##面经##腾讯##百度##微软##京东##自然语言处理#