秋招算法面筋,许愿offer
陌陌
一面
介绍项目
写算法,一个递归
推到LR,概率,最大似然,损失函数,求导
文本相似度的一些方法
编辑距离,n-gram,有什么缺点
场景题,一亿条语料,怎么求相似的句子
text-cnn网络结构,反向传播;出现badcase怎么查
二面
问项目
1.transformer的结构,原理,attention
文本怎么分类
word2vec,fasttext
tf-idf,原理优缺点
快排
1千万条数据去重,自己挖坑写trie
三面
讲项目
CRF原理
新词发现怎么做,怎么确定是新词
欢聚时代
一面
lr和dnn的优缺点
随机森林的原理,boost和bagging的区别
随机森林为什么可以减小方差
偏差和方差的原理
attention的原理是什么
word2vec原理,负采样和分层softmax
cbow和skip-gram 哪个训练更快,哪个效果更好,为什么?
python map函数和列表表达式的区别
python中怎么导入第三方文件
写代码:快排和二叉树层次遍历
二面
讲项目
解决过拟合的方法
梯度优化算法
画transfomer,attenttion和rnn的区别
layer normalization的作用
解决过拟合的方法
n和整数中最大的k个数
三面反手被挂,哈哈哈,太迷了
面试官好逗,感觉是一个很开心的人
讲项目,吐槽现在啥都ai了,吐槽项目和比赛不靠谱…
介绍一个模型
聊天聊项目
阿里口碑饿了么
一面
二面
三面挂
滴滴面试体验很好,sp专场,早上十点开始面试,面完二面就十二点一十了,滴滴好准备午饭,吃完饭差不多等到十二点四十多开始三面,面到下午两点过几分....
一面(四五十分钟)
1.自我介绍
2.讲第一个项目
3.过拟合的表现是什么,怎么防止过拟合
4.L1和L2的区别,为什么L1能稀疏权重,原理是什么
5你刚刚写的几种过拟合方法,你在项目中使用的顺序是怎样的,为什么?
6.代码题:判断链表是否有环
二面(一个小时+)
1.自我介绍,介绍一个比赛项目
2.怎么做特征选择
3.怎么处理高维稀疏数据
4.有没有了解凸优化方面知识
5.xgboost的原理,为什么要用二阶导,二阶导作用是什么
6.L1正则在不可导点怎么求梯度,给你一个不可显示表示函数怎么求梯度
7.为什么要用深度学习,和机器学习相比有哪些优缺点,树模型也可表示非线性、和神经网络相比有什么优缺点
8.dropout原理,训练和预测分别是是怎么做的,BN的原理
9.attention的原理和作用
10.transfomer和rnn的区别,bert的原理,有了transfomer为什么还要bert
11.有没有想过为什么要用预训练,从优化的角度考虑,扯到了先验和参数初始化
12.有什么要问的
三面(一个小时+)
1.代码:二叉树两个节点的最近的公共父节点,非递归和递归的方式。时间复杂度。
2.xgboost和RF在性能上差异,RF的随机性体现在哪儿?
3.项目中的难点是什么,怎么解决的,有什么提升。
4.LSTM和GRU有什么区别
5.LSTM和CRF可以分别做命名实体识别,为什么要把它们结合在一起,怎么将LSTM和CRF结合起来的
6.CRF怎么解决label偏移的,从HMM到MEMM再到CRF,是怎么演变的
7.决策树建树有哪些方法,能写下公式吗?每种方法对应哪些算法ID3,C4.5,CART,这些算法有什么优缺点,为什么CART即可以做分类又可以做回归,他们的损失函数是什么呢?
8.了解堆排序吗?建堆的时间复杂度是多少
9.概率题:两个人抛硬币,第一个人赢的概率。
10.看过哪些论文,实验室研究方向,对自己未来的期望和发展
加面:
介绍两个项目
GDBT和NN处理特征有什么区别,这么多场景该怎么进行模型选择等等
attention和self-attention
计算机基础
hash冲突解决办法
java gc机制了解吗
线程之间的通信,怎么保证线程同步
往堆里插入一个数的时间复杂度是多少
hr面一个小时左右
搜狗
一面
1.讲项目
2.为什么用Bi-LSTM,数据量这么小,为什么不用传统的CRF,CRF的损失函数,怎么做解码的
3.项目里面用到了CYK,然后让我写动态规划的伪码,写的有点久,感觉自己给自己挖了了坑
4.怎么存CNF树,应该是用字典树
5.代码题:二叉树最近公共父节点
6.代码题:每一个位置上有很多个词表,从每一个位置上的词表中选一个词,组成一句话,求所有能组合成的句子
7.讲一些query和title的一些文本相似度的方法
8.有了解什么最新的深度模型,transformer,bert等,bert和XL-Net的区别。
9.你是哪儿人啊,以后会在北京长期发展吗?
10.有什么要问我的
美团地图部
一面(一小时+)
按照简历,一条一条的过,感觉身体被掏空,可能有遗忘的
1.介绍项目
2.lstm的结构图,写公式,怎么理解双向的
3.介绍crf,crf怎么计算的,怎么优化的,怎么解码的,前后向概率,维特比算法,EM算法是有监督还是无监督的
4.介绍bi-lstm+crf,损失函数,怎么计算梯度和更新的
6.讲下神经网络的反向传播,你知道怎么设置学习率吗?学习率过大会有什么影响,怎么调节学习率,梯度优化里面怎么衰减学习率的,还有哪些梯度优化算法
5.介绍self-attention,transfomer的结构,残差连接,layer normalization的原理和作用
6.讲一下word2vec,skip-gram,cbow,分层softmax,负采样
7.介绍svm,思想,对偶条件
8.介绍GBDT,xgboost和lightgbm三种算法,他们的区别和联系是什么,面试官后面还给我好好的讲了一下
9.写一下lr的求导公式,写一下sigmiod的求导
10.代码题,一个01组成的字符串,求0和1相等的最长子串
二面(一小时+)问的比较多,很多都忘了
开始闲聊,问在学校学习了哪些课程,机器学习和数据挖掘讲了些什么
问项目,算法基础
transfomer,self attention,vae
了不了解gan,怎么优化判别器和生成器的
介绍lr,bp算法
讲一下集成算法
python基础知识
set,list,tuple,dict的区别
is 和==的区别
map,lambda表达式
迭代器和生成器的区别
算法题leetcode 两个有序数组求中位数
给一个整数,求这个整数二进制中1的个数
给定一个整数,求小于该整数的数二进制1的个数的和。
又开始闲聊,你是怎么学习算法的,转到算法做了哪些工作,是怎么做比赛的。
三面
技术面,聊人生,聊理想?
如果你是leader你会怎么做?
计算机基础,丢包,死锁
两个小时呀!
从早上十点进美团,晚上八点半出美团,一天呀,三面
小米闲聊对话
一面是个小姐姐
介绍项目,两个项目,从项目中解决一些问题
怎么解决oov的问题我bpe
transfomer的原理和结构,优缺点
二面是个小哥哥
介绍项目,有趣的东西
seq2seq训练和预测有什么区别,sampling shift,还有什么可以解决这个问题,知道seqGan
代码:二叉树层次遍历、n前面的所有质数
变长输入怎么处理,有什么小trick
度小满
一面
讲项目
问基础python,set的底层是什么,list的底层是什么
mapreduce实现从大数据找到一些文本,mapper 和reducer 分别怎么实现
linux命令,top,sort,cut,split,shell
xgboost重要性怎么实现
代码lru的原理,最大的第k个数
二面
介绍项目
讲一下crf和lstm,为什么要将他们结合在一起
怎么防止过拟合。
如果训练过程中loss不变了,主要是什么原因引起的,从数据的角度和模型的角度考虑。
glove和word2vec的区别,fasttext的区别
余弦距离和欧式距离有什么区别。
gbdt基分类器用的是什么模型,怎么做分类的。
代码:二叉树的深度,非递归
三面
介绍项目
lightgbm和xgb的区别,它们选取特征的方式是一样的吗?
代码:最小的k个数
#阿里巴巴##陌陌##搜狗##欢聚集团##秋招##面经##算法工程师#