秋招漫漫长路,唯有努力方不负己
大晚上睡不着,回想起去年这个时候开始,度过的一段艰难而又充实的日子,一时兴起想写一篇帖子,记录一下这段时光。
整个实习+秋招,面试过几乎所有的主流互联网公司,面试经历也是极其丰富了😂,功夫不负有心人,实习和秋招拿到过大多数大厂的offer,包括百度,腾讯,头条,美团,滴滴,京东,小米,快手等等
因为没有面试后整理的习惯,刚开始的时候只是简单地记录了一下面试题目,后来干脆有些面试没有记录了。现在想把当时的记录分享出来,给大家一个参考~
三、小米
#校招##实习#
整个实习+秋招,面试过几乎所有的主流互联网公司,面试经历也是极其丰富了😂,功夫不负有心人,实习和秋招拿到过大多数大厂的offer,包括百度,腾讯,头条,美团,滴滴,京东,小米,快手等等
因为没有面试后整理的习惯,刚开始的时候只是简单地记录了一下面试题目,后来干脆有些面试没有记录了。现在想把当时的记录分享出来,给大家一个参考~
有感而发,资料都在电脑上,先占个坑吧,等有空整理一下面试经验,再补充😆
投的都是nlp相关的算法岗
头条面了很多次,其实只要你面试表现的还行,后续还有有很多部门捞,我整个实习加秋招面大概面了头条四五个部门,到后来拿到头条的offer拒了之后还一直有人给我打电话邀请面试
一. 头条-大数据
编程题:
求逆序
求两个链表的第一个公共节点
问题:
bagging和boosting的区别
gbdt 残差是什么?
xgboost 和gbdt的区别,xgboost的正则项怎么设计,如果使用的其他的机器学习方法,怎么设计正则项
设计一个多分类的损失函数
交叉熵损失函数的p和q代表啥意义
cnn pooling的作用
介绍一下lstm
dropout有什么作用
batch normalization干什么用的
二、字节跳动-广告
算法题:
二叉搜索树的删除,删除后要求调整节点还变成一颗二叉搜索树,递归
给定两个线段集,求线段集的交集
复杂链表的复制
问题:
cnn的输出大小以及参数计算
二分类用什么评估指标,P,R,F,AUC 是什么,ROC的横纵坐标表示什么
BBPT rnn的反向传播推导公式
什么是梯度消失和梯度爆炸,lstm怎么解决梯度消失和梯度爆炸
lstm里面都有哪些激活函数,sigmoid和tanh,为什么要用这两个而不用其他的
seq2seq是什么,attention了解吗
python中的生成器和迭代器,装饰器
大list不能一次性加载到内存,在python中要用什么方法
什么是过拟合和欠拟合,增加数据量能不能解决过拟合和欠拟合
boosting和bagging的区别,GBDT的原理是什么,残差是什么,基分类器是什么
什么是cart回归树,随机森林需不需要剪枝
xgboost了解吗
ner的方法有哪些
了不了解FM,FM和DeepFM
NLP领域最前沿的算法
beam-search听说过吗
bert是什么,bert相对于transformer好在哪里?
极大似然和最大后验 √
不同领域下的ner
ltr
transformer前馈怎么设计的
算法题:
1. 一个数组,一个target,求两个元素相加等于这个target:排序+两个指针(nlogn),使用dict保存
2. 数组中乘积最大的子串
3. 数组中把大于0的放在前面,0放在后面
4. 旋转数组中找target
问题:
textcnn为什么卷积之后是一个一维向量?用的是点乘
textcnn后面接softmax进行三分类,全连接层的参数是多少个
什么是crf,维特比算法画图和流程
ltr
bert的结构,multi-head self-attention的结构是什么样的,KQV结合的公式
为什么要这样用,如果用普通的attention会怎么样,self-attention好在哪里。
multi-head self-attention相对于cnn和lstm等好在哪里
softmax的公式
四、京东搜索
算法题:数组组成的最大整数
transformer的结构
adam优化器的原理
crf的原理
五、京东
已知2的10次方等于1024,是四位数,那么2的10000次方是几位数?
因为4位数可以表示成10的4次方
逻辑回归,损失函数,梯度下降求导推导,p表示的是概率吗?
六、拼多多
算法题:
1. 给定三个集合,相交的圆,求它们的交集比上并集的概率?
三个圆的取值范围是:
f(x,y) < a
g(x,y) < b
u(x,y) < c
编程实现
蒙特卡洛采样
2. 求1~1000的数中,6出现的次数
3. 1~n的无序数据流中,有一个数缺失,求缺失的数
4. 给定一个代码串
para:以字母开头,后面可以是数字也可以是字母
digit:以数字开头,后面跟的都是数字
unknow:以数字开头,后面跟的是字母
已经定义好三个函数:
is_delim : 判断是否是分隔符
is_alpha:判断是否是字符
is_digit:判断是否是数字
方法2提示:是否可以用其他工具来做:自动机
七、滴滴
算法题:
1. 股票买卖一次的最大收益,可以当天买卖:使用min保存第i天及其之前的最低价格,dp[i]表示当天卖出的最大获利,
dp[i] = num[i] - min, return max(dp)
2. 给定一个数组,和一个target,求数组中的三个数的和最接近target,假设只存在一组,返回3个数
hmm和crf的转移矩阵的区别
bert哪些方面可以并行:multi head self-attention,前馈层可以并行
传统的ner算法,hmm,mehmm,之类的,有比较吗
hmm和crf的区别
线性回归
吉布斯采样的过程
kmeans聚类的过程
假设没有坐标系,只有距离计算,如何找到簇的中心,提示梯度下降
八、头条
用lambda实现斐波那契函数
svm的优缺点
word2vec了解吗,负采样的目的,目标函数
transformer的层次结构
核函数的作用?高维映射?减少计算,不用计算内积?
卷积的作用
股票买卖问题,买卖一次,买卖两次
字符串的旋转abcdef 变为cdefab:做三次旋转
甲获胜的概率为0.6,求三局两胜,和五局三胜甲选哪个更好
九、腾讯微信
一面讨论题
给定一个doc集合,以及一个比较函数,函数返回两个文档的相似度。怎么对这个文档集进行去重
一面算法:
链表的归并排序
多叉树的拓扑结构,判断两棵树的拓扑结构是不是相同
二面:
给定一个数据,已知这一组数据是由三个高斯分布采样得到的,求这三个分布的均值和方差
高斯混合分布 。 em算法
lda的原理,为什么先验要选择使用狄利克雷分布
如何进行调参的?调参的trick,调参的方法
三面:
算法题:给定一个数组,将数组转换成三段的形式,大于0的在左边,等于0的在中间,小于0的在右边
使用两次的快排的partition,能不能只走一趟?用三个指针。
用三个指针,left指向0,代表大于零的右边界,right指向len(num)-1代表小于零的左边界,指针p从左到右进行遍历。当p的值小于0的话,则和right交换位置,然后right左移;当p值大于0时,则和left交换位置,然后left指针右移;如果等于0的话则不管,p指针右移。直到指针p与right相遇
另外一个部门
一面:
编辑距离
十、搜狗
1. 核心词提取,title,content怎么结合
初始化的时候能不能把所有的权重都赋成0,或者都赋成一个很大的值
梯度消失和梯度爆炸的问题
训练时loss像波浪线一样,是因为什么原因
初始化,输入数据不好?要batch nor?好像不对
learning rate设置过大
优化器,adam和mini batch sgd有啥不同,具体说一下
核心词提取三种咋融合,ltr了解多少,title和click query,content咋结合,权重呢?是否有做一个对比,例如说只从title中提的效果是什么样的?要不要说现在还没用起来
lda咋用
点击模型
算法题: 在旋转数组中找一个数
一个无序数组,求前-后最大的差值
开放题:一个人在走,一段是路,一段是往前走的电梯,问在哪停下来洗鞋带能使得时间最短
搜索的框架结构,点击