(实习算法岗)百度/趣头条/人人车/汇量面经
渣硕也分享一波面经~今年2月中旬开始找的实习, 也是看着牛油们的面经长大的....哎, 感叹和大佬们差距太远了...一路上也是边面边刷题,复习
趣头条NLP(一面挂🤣)
- 一开始面趣头条面的是NLP, 但自己没多少NLP的经验,果然挂了,时间太远,只能尽量回忆了
一面是牛客视频, 面试官远程办公,问了
1. 自我介绍
2. 说了一下KDD的paper,因为涉及到GAN, 感觉面试官不熟悉GAN, 所以没怎么接着问
3. word2vec的模型,流程. bert里面的self-attn是怎么做的, attn的mask是干嘛用的.LSTM,seq2seq这些
4. 说一下SVM, 硬间隔,软间隔,核函数, 两个系数:,对偶, KKT, 拉格朗日...
5. 打比赛用到了GBDT,XGB, 问了两者的原理和区别
6. 编程: 跳台阶和判断链表是否有环
7.问了熟悉命名实体识别吗,还有设计轮转对话如何设计
总结: 除了...NLP的, 其他都回答上了,但还是挂了
百度数据挖掘
- 自我介绍
- 仔细问了github的repo,各种情况如何处理的, 连续值离散值如何处理, 如何评价效果等,随机森林,KNN,GBDT都涉及到都问了
- AUC展开问了一下, 首先是优缺点, 然后不平衡样本如何处理, 不同的采样会导致AUC如何变化
- C++ 引用和指针的区别, STL里vector的原理, 面向对象, private public,protect的区别
- 编程: 2个大字典取交集, 时间复杂度O(n)
总结: 基本都答上来了, 第二天接到原来打过来的座机, 但漏接了, 之后就再也没打....
人人车,推荐算法(Offer)
-自我介绍
-github的项目,没怎么深入
- 比赛, 怎么做的,用了那些模型, 模型的原理, XGB调参,和top3的差距主要在哪里
- ID3,C4.5.CART树的区别(一个个讲的, 谁解决了谁不能解决的问题,如何解决的,缺失值如何处理,说了scikit-learn里面的GBDT, 原理上可以处理missing value, 但其实里面并未实现)
- PCA, 怎么做数据异常检测, 数据异常点检测算法
- 常规的机器学习算法, 主要是原理
- 简单的编程
汇量, 反作弊算法(Offer)
一面:
1. 自我介绍
2. XGB和GBDT,RF的区别,
3.GBDT如何做分类
4. L1,L2区别, L1 不可导如何处理?
5.给了个场景问如何去做
6.编程:
2个数组递减, 选出和为K的几个数字(写了双指针扫描的做法)
接着马上二面:
1. 问了写简历的内容,能实习多久
2.平时如何学习
3. 两三个场景题
三面HR
1. 各种过去的经历, 如何学习
2. 反作弊相关的算法,数据挖掘相关的经验
3. 聊人生
后面就是三月份了,暂时先写这么点