算法渣硕面经(阿里、腾讯、美团等),攒人品

一直在等阿里的三面,最近有预感可能要面了,发一波面经攒人品
真。末流985渣硕的春招算法实习面经,从3月初到现在大大小小也投了不少家公司,其中大多数挂在了一面,真的是惨不忍睹
除了下面这些公司还有更多的没过笔试和简历筛选
如此之渣的我,到现在也收到了其中两个公司的offer,希望大家都可以拿到理想的offer
下面上干货
............................................................................................................

360浏览器事业部 推荐算法工程师

一面

1.项目

2.关键字怎么提取的,TF-IDF有改进么,怎么改进的

3.命名实体怎么得到的,原理了解

4.LDA的原理是什么,使用了哪个框架

5.狄利克雷分布能具体说说么

6.深度学习了解么

7.RNN LSTM了解么

8.有什么比较熟悉的算法

9.xgboost的原理

10.有10个排好序的数据库,那么我要找整个的中位数,怎么找

11.一个路口,一个小时通过一个车的概率是0.9,那么20分钟内通过车的概率是多少

12.我有一个32位的id是唯一的,那么我想压缩一下,让他还唯一,怎么压缩

二面

1.项目

2.SVM原始问题为什么要转化为对偶问题,为什么对偶问题就好求解,原始问题不能求解么

3.K-means 中我想聚成100类 结果发现只能聚成98类,为什么

4.进程中的内存分段是怎样的

5.每个线程有哪些东西是自己独享的

6.一枚不均匀的硬币,我抛了100次,有70次朝上,那么第101次朝上的概率是多少

这个概率怎么样,公示是如何推导出来的

7.给你个字符串,字符串是个数字,怎么转换为int型,不用库函数的话

8.4个海盗,100个金币,每个人轮流提方案,如果你的方案有半数以上通过,那么久可以,否则就会被杀掉,如果你是第一个人,那么你怎么提方案比较好

9.你的优点是什么

............................................................................................................
美团点评 到店综合 算法实习
一面

1.先聊了半天项目,从细节创新点,讲到了整体的架构。聊了大概15分钟左右。。

2.GBDT的原理,以及常用的调参的参数

3.xgboost的跟GBDT比优点都有哪些

4.一道SQL题,count(1),count(*),count(列名) 这三个有什么区别

然后问了下什么时候能来实习,实习多久

我问了他他这边都做什么,就这么愉快的结束了面试

二面

1.L1、L2正则化,区别

2.项目,长短期兴趣,如何验证,时间敏感

3.文本内容推荐中有哪些内容可以应用到商品团购推荐当中去

4.Xgboost中的行抽样,可以起到哪些作用

5.样本少了不是会过拟合么,为什么行抽样可以防止过拟合

6.算法题,一个数组,找出第k大的数

这些方法的时间复杂度是多少

接下来都是我问他的

算法工程师的工作模式大概是什么

他这边推荐主要是基于传统机器学习还是深度学习

可以不可以将深度学习关于图像方面的东西加入到推荐系统中去

接下来大概还有几次面试

............................................................................................................

腾讯IEG安全部门一面(提前批)

你的亮点是什么,你都会什么

1.说一下构建模型的过程

2.特征选择方法都有哪些

3.常用的损失函数和适用场景

4.LR和SVM原理

5.LR和SVM这两个应用起来有什么不同

6.PCA说一下

7.你都会什么聚类方法

8.模型的评价方法有哪些

9.ROC怎么画

10.你知道SoftMax么

11.野指针是什么意思

12.快排的思想是什么

13.Linux中查找符合一定规则的文件名怎么查找,或者用脚本也行

14.C++会不会  虚函数是什么意思

15.我有一个文本,那么我要统计每个词出现的频率,Python上应该怎么做

16.编代码的时候如何申请内存,有哪些方法

17.你玩游戏么,都玩过哪些游戏

腾讯沈阳现场一面

1.项目

2.特征选择方法都有用过哪些

3.随机森林怎么进行特征选择

4.用过哪些机器学习算法

5.加密方法知道哪些

6.MD5可逆么

7.word2vec用过么

8.极大似然估计是什么意思

9.上过哪些课

10.排序算法哪些时间复杂度比较低

11.计算机网络了解多少

20分钟,问题除了加密的部分其他应该都答得还可以

然后出来之后被秒挂了

............................................................................................................
阿里 新零售 天猫 算法工程师-机器学习
一面
先是一个简单的自我介绍;

1.然后介绍了项目的框架和主要创新点;

2.说一下随机森林和Adaboost,以及区别

3.说一下GBDT和Adaboost,以及区别

4.说一下LDA的原理

5.对于PCA,会有第一主成分、第二主成分,怎么为什么第一主成分是第一,原因是什么?

6.PCA的主成分是怎么得到的

二面

先是简单问了一些关于什么时候可以实习,学校这边的状况如何的问题。

然后开始聊项目,项目聊得比较细,我做了哪些创新点,具体怎么做的,有问题面试官都会追问清楚。

1.说一下SVM

2.聊了一下之前本科的实习经历

3.面向对象的三要素

4.对深度学习了解多少

5.你觉得深度学习的方法和传统机器学习比,有什么大的优势

............................................................................................................
GrowingIO机器学习工程师(实习)
一面

1.项目

2.当我们要求准确率很高,但是不在意召回率的时候,可以怎样处理。

3.回归算法用于分类的阈值如何确定呢

4.xgboost,说一下原理,步长如何设定

二面,总监面

这次的二面问的问题都很open,都是一些如何让我的推荐系统可以更好的应用于大数据的实际场景当中去的问题。

首先是一个1分钟的简短的自我介绍。

还是聊项目,创新点,以及系统架构和实现。

1.k-means中的k如何确定呢?

2.除了k-means,还可以用什么聚类方法,或者你还熟悉什么聚类方法

3.层次聚类的话,你又如何判断聚成多少类合适?

............................................................................................................
好未来
一面

1.用过什么语言,用没用过R,语言都干什么用的

2.朴素贝叶斯原理

3.TF-IDF原理

4.性能评价指标,准确率召回率是怎么回事,二分类 和多分类的评价方法

5.除了推荐方面的东西,你还做过一些别的事情么

6.用过scikit-learn numpy么

7.LDA你是怎么用的,LDA的表现如何,主题分的效果好不好

8.你觉得基于内容的方法和协同过滤有什么不同

9.还有就是一些基本情况了,用没用过数据库啊之类的,数据库用的怎么样 sql会不会

............................................................................................................
数旦科技
一面

1.数据库 三范式

2.bagging  和boosting 哪个可以让结果的方差更小一些,为什么?

3.你都知道哪些分类算法

4.bagging 和boosting的区别是什么

5.排序算法都有什么?当一个数据特别乱序的时候使用哪个排序算法更好一些

6.你论文都怎么搜索的,如何保证质量?

7.面向对象 多态 继承 的关系

8.面对大数据量的推荐 应该如何实现

9.说说协同过滤是怎么回事

10.你常用的推荐算法都有什么

11.集成学习为什么要用简单的基学习器,不用一个复杂一点的学习器

12.非线性的数据,可以使用什么分类器进行分类
............................................................................................................


搜狐算法实习生
一面

先问项目,然后

1.LDA的原理是什么?

5.推荐的时候矩阵一定是稀疏的,对于这个稀疏矩阵应该如何处理?

6.如何从文档中提取关键字?

7.讲一讲tf-idf是什么意思

8.hashmap你用过么,底层是如何实现的?

9.计算机网络你有学过吧,还记得什么么?

10. Android 的生命周期是什么?

11.你用过Python 那么你Python都用过哪些机器学习的库?

12.你觉着你自己都有哪些优点呢?
............................................................................................................
搜狐(智能推荐平台)
一面

主要问的都是项目

手撸代码,不用库函数求一个数的立方根,要求误差小于0.01

#实习##面经##算法工程师#
全部评论
不错的,lz好像被问了很多推荐系统和nlp方面的东西啊 
点赞 回复 分享
发布于 2018-04-26 18:58
给大佬点赞,很有用的面经。最后决定去哪了吗?
点赞 回复 分享
发布于 2018-05-01 01:18
校友啊,点赞点赞
点赞 回复 分享
发布于 2018-05-01 16:46
问一下,这些面经上的问题是不是针对你简历上来问的,感觉我都不熟呢?
点赞 回复 分享
发布于 2018-05-05 15:30
怎么还有问你安卓生命周期的。。。。一阵恐慌,这个也会被问??
点赞 回复 分享
发布于 2018-05-05 18:39
楼主你好,我想问一下抛不均匀硬币那题答案是7/10吗?
点赞 回复 分享
发布于 2018-05-08 11:21
请问楼主,面试官让说一下PCA,从哪些方面说呢?
点赞 回复 分享
发布于 2018-08-23 19:44
请问“我有一个32位的id是唯一的,那么我想压缩一下,让他还唯一,怎么压缩”应该怎么回答
点赞 回复 分享
发布于 2018-10-22 12:29
楼主最后去哪实习了
点赞 回复 分享
发布于 2018-10-23 12:37
“K-means 中我想聚成100类 结果发现只能聚成98类,为什么”这道题应该怎样答,搜不到点啊(尴尬)
点赞 回复 分享
发布于 2018-10-23 13:49

相关推荐

HR部门一面(2.25)手撕:LRU+一道SQL1. 项目是否上线?为什么不上线?2. 大营销项目是否是Demo项目?3. Java集合类型有哪些?4. ArrayList源码看过吗?扩容机制?是否可以自己设置容量?设置的太小或者太大有什么问题?5. 集合有哪些线程安全?6. Hash Table是线程安全的吗?7. HashMap和Hash Table有什么区别呢?8. HashMap能保持插入之后的读写顺序吗?9. 哪个类型能保证HashMap插入节点的顺序?10. ConcurrentHashMap线程安全是怎么实现的?11. 什么是线程、进程、协程?12. 有没有了解Java新版的虚拟线程?13. 介绍TCP连接过程?14. 介绍TCP结束过程?15. 有没有了解http对tcp做了哪些优化,来简化开发?16. http1.1和http2有什么区别?17. 介绍一下https的加密过程?18. 传输数据是采用什么加密?19. 非对称加密和对称加密的优缺点?20. 有个大数据的列表,之前是循环的for each处理,怎么简单的提高性能?21. 怎么重复利用线程?22. Mysql隔离级别?23. 什么是幻读?24. Mysql的数据库引擎?25. Mysql的索引类型?26. 什么是覆盖索引?27. 一次查询可以用多个索引吗?(索引合并)28. Mysql什么时候会出现死锁?29. 什么是索引碎片化?30. Sql的执行顺序?31. 如果Blog打不开,一直转圈,如何排查?32. Blog有没有使用数据库?如果是大营销系统,可能是什么问题?33. 用过大模型吗?deepseek大模型对其它大模型有什么优点?34. 你目前的Base?二面(3.3 凉)算法题 :Welcome to Tencent 按字符串反转([反转字符串中的单词](*******************************************************))项目:1. 有哪几个比较复杂的问题?通过什么方式解决的?2. 中奖概率怎么设计的?什么样的空间?Log(n)算法是什么?3. 奖品数据永远不会很大?需要设计两种算法吗?4. 抽奖的人分配什么东西?5. 1W个人,100个奖品,奖品概率为0.01? 能否全部抽完?如何保证全部抽完?6. 怎么控制随机性?通过什么算法去控制,让他基本在1W人能够全部抽到?7. 自定义组件来做分库分表怎么实现的?8. 散列会散列到多少张表上去?9. 用户的ID是怎么样的?哈希完之后的结果是怎么样的?10. 我看你是学大数据的,为什么没有往大数据方向走?11. 有没有往大数据和算法方面走的倾向?基于什么背景考虑?12. 看相关源码?有什么不错的想法分享吗?13. Redis的stream场景?14. 使用方式?15. 和RabbitMQ有什么区别?16. 为什么Stream有消息丢失问题?17. Redis的持久化有哪些方式?
点赞 评论 收藏
分享
评论
16
219
分享

创作者周榜

更多
牛客网
牛客企业服务