秋招算法面筋,许愿offer


陌陌

一面

介绍项目

写算法,一个递归

推到LR,概率,最大似然,损失函数,求导

文本相似度的一些方法

编辑距离,n-gram,有什么缺点

场景题,一亿条语料,怎么求相似的句子

text-cnn网络结构,反向传播;出现badcase怎么查


二面

问项目

1.transformer的结构,原理,attention

文本怎么分类

word2vec,fasttext

tf-idf,原理优缺点

快排

1千万条数据去重,自己挖坑写trie


三面

讲项目

CRF原理

新词发现怎么做,怎么确定是新词


欢聚时代

一面

lr和dnn的优缺点

随机森林的原理,boost和bagging的区别

随机森林为什么可以减小方差

偏差和方差的原理

attention的原理是什么

word2vec原理,负采样和分层softmax

cbow和skip-gram 哪个训练更快,哪个效果更好,为什么?

python map函数和列表表达式的区别

python中怎么导入第三方文件

写代码:快排和二叉树层次遍历


二面

讲项目

解决过拟合的方法

梯度优化算法

画transfomer,attenttion和rnn的区别

layer normalization的作用

解决过拟合的方法

n和整数中最大的k个数


三面反手被挂,哈哈哈,太迷了

面试官好逗,感觉是一个很开心的人

讲项目,吐槽现在啥都ai了,吐槽项目和比赛不靠谱…

介绍一个模型

聊天聊项目


阿里口碑饿了么

一面

二面

三面挂


滴滴面试体验很好,sp专场,早上十点开始面试,面完二面就十二点一十了,滴滴好准备午饭,吃完饭差不多等到十二点四十多开始三面,面到下午两点过几分....

一面(四五十分钟)

1.自我介绍

2.讲第一个项目

3.过拟合的表现是什么,怎么防止过拟合

4.L1和L2的区别,为什么L1能稀疏权重,原理是什么

5你刚刚写的几种过拟合方法,你在项目中使用的顺序是怎样的,为什么?

6.代码题:判断链表是否有环


二面(一个小时+)

1.自我介绍,介绍一个比赛项目

2.怎么做特征选择

3.怎么处理高维稀疏数据

4.有没有了解凸优化方面知识

5.xgboost的原理,为什么要用二阶导,二阶导作用是什么

6.L1正则在不可导点怎么求梯度,给你一个不可显示表示函数怎么求梯度

7.为什么要用深度学习,和机器学习相比有哪些优缺点,树模型也可表示非线性、和神经网络相比有什么优缺点

8.dropout原理,训练和预测分别是是怎么做的,BN的原理

9.attention的原理和作用

10.transfomer和rnn的区别,bert的原理,有了transfomer为什么还要bert

11.有没有想过为什么要用预训练,从优化的角度考虑,扯到了先验和参数初始化

12.有什么要问的


三面(一个小时+)

1.代码:二叉树两个节点的最近的公共父节点,非递归和递归的方式。时间复杂度。

2.xgboost和RF在性能上差异,RF的随机性体现在哪儿?

3.项目中的难点是什么,怎么解决的,有什么提升。

4.LSTM和GRU有什么区别

5.LSTM和CRF可以分别做命名实体识别,为什么要把它们结合在一起,怎么将LSTM和CRF结合起来的

6.CRF怎么解决label偏移的,从HMM到MEMM再到CRF,是怎么演变的

7.决策树建树有哪些方法,能写下公式吗?每种方法对应哪些算法ID3,C4.5,CART,这些算法有什么优缺点,为什么CART即可以做分类又可以做回归,他们的损失函数是什么呢?

8.了解堆排序吗?建堆的时间复杂度是多少

9.概率题:两个人抛硬币,第一个人赢的概率。

10.看过哪些论文,实验室研究方向,对自己未来的期望和发展


加面:

介绍两个项目

GDBT和NN处理特征有什么区别,这么多场景该怎么进行模型选择等等

attention和self-attention

计算机基础

hash冲突解决办法

java gc机制了解吗

线程之间的通信,怎么保证线程同步

往堆里插入一个数的时间复杂度是多少


hr面一个小时左右


搜狗

一面

1.讲项目

2.为什么用Bi-LSTM,数据量这么小,为什么不用传统的CRF,CRF的损失函数,怎么做解码的

3.项目里面用到了CYK,然后让我写动态规划的伪码,写的有点久,感觉自己给自己挖了了坑

4.怎么存CNF树,应该是用字典树

5.代码题:二叉树最近公共父节点

6.代码题:每一个位置上有很多个词表,从每一个位置上的词表中选一个词,组成一句话,求所有能组合成的句子

7.讲一些query和title的一些文本相似度的方法

8.有了解什么最新的深度模型,transformer,bert等,bert和XL-Net的区别。

9.你是哪儿人啊,以后会在北京长期发展吗?

10.有什么要问我的


美团地图部

一面(一小时+)

按照简历,一条一条的过,感觉身体被掏空,可能有遗忘的

1.介绍项目

2.lstm的结构图,写公式,怎么理解双向的

3.介绍crf,crf怎么计算的,怎么优化的,怎么解码的,前后向概率,维特比算法,EM算法是有监督还是无监督的

4.介绍bi-lstm+crf,损失函数,怎么计算梯度和更新的

6.讲下神经网络的反向传播,你知道怎么设置学习率吗?学习率过大会有什么影响,怎么调节学习率,梯度优化里面怎么衰减学习率的,还有哪些梯度优化算法

5.介绍self-attention,transfomer的结构,残差连接,layer normalization的原理和作用

6.讲一下word2vec,skip-gram,cbow,分层softmax,负采样

7.介绍svm,思想,对偶条件

8.介绍GBDT,xgboost和lightgbm三种算法,他们的区别和联系是什么,面试官后面还给我好好的讲了一下

9.写一下lr的求导公式,写一下sigmiod的求导

10.代码题,一个01组成的字符串,求0和1相等的最长子串


二面(一小时+)问的比较多,很多都忘了

开始闲聊,问在学校学习了哪些课程,机器学习和数据挖掘讲了些什么

问项目,算法基础

transfomer,self attention,vae

了不了解gan,怎么优化判别器和生成器的

介绍lr,bp算法

讲一下集成算法

python基础知识

set,list,tuple,dict的区别

is 和==的区别

map,lambda表达式

迭代器和生成器的区别


算法题leetcode 两个有序数组求中位数

给一个整数,求这个整数二进制中1的个数

给定一个整数,求小于该整数的数二进制1的个数的和。


又开始闲聊,你是怎么学习算法的,转到算法做了哪些工作,是怎么做比赛的。


三面

技术面,聊人生,聊理想?

如果你是leader你会怎么做?

计算机基础,丢包,死锁

两个小时呀!

从早上十点进美团,晚上八点半出美团,一天呀,三面



小米闲聊对话

一面是个小姐姐

介绍项目,两个项目,从项目中解决一些问题

怎么解决oov的问题我bpe

transfomer的原理和结构,优缺点


二面是个小哥哥

介绍项目,有趣的东西

seq2seq训练和预测有什么区别,sampling shift,还有什么可以解决这个问题,知道seqGan

代码:二叉树层次遍历、n前面的所有质数

变长输入怎么处理,有什么小trick



度小满

一面

讲项目

问基础python,set的底层是什么,list的底层是什么

mapreduce实现从大数据找到一些文本,mapper 和reducer 分别怎么实现

linux命令,top,sort,cut,split,shell

xgboost重要性怎么实现

代码lru的原理,最大的第k个数


二面

介绍项目

讲一下crf和lstm,为什么要将他们结合在一起

怎么防止过拟合。

如果训练过程中loss不变了,主要是什么原因引起的,从数据的角度和模型的角度考虑。

glove和word2vec的区别,fasttext的区别

余弦距离和欧式距离有什么区别。

gbdt基分类器用的是什么模型,怎么做分类的。

代码:二叉树的深度,非递归


三面

介绍项目

lightgbm和xgb的区别,它们选取特征的方式是一样的吗?

代码:最小的k个数

#阿里巴巴##陌陌##搜狗##欢聚集团##秋招##面经##算法工程师#
全部评论
不错不错
点赞 回复 分享
发布于 2019-09-21 18:19
大佬最后准备去哪儿了😂
点赞 回复 分享
发布于 2019-09-21 18:43
大佬是做nlp的吗?
点赞 回复 分享
发布于 2019-09-21 20:21
给大佬打call
点赞 回复 分享
发布于 2019-09-22 08:59
字节大佬又跑出来和我们抢饭碗
点赞 回复 分享
发布于 2019-09-22 10:42

相关推荐

牛客101244697号:这个衣服和发型不去投偶像练习生?
点赞 评论 收藏
分享
评论
7
82
分享
牛客网
牛客企业服务