2022-02-24 19:23 已编辑天津大学数据分析师

关注

机器学习与数据挖掘高频面试题及答案

机器学习与数据挖掘-3

11.模型过拟合怎么处理（百度）

参考答案

1.获取更多数据，扩大数据量。

2.降低模型复杂度。

3.添加正则项。

4.改为集成学习。

12.介绍一下模型融合（百度）

参考答案

Bagging就是采用有放回的方式进行抽样，用抽样的样本建立子模型,对子模型进行训练，这个过程重复多次，最后进行融合。例如随机森林。

13.文本匹配算法（中电十所）

参考答案

传统的文本匹配算法Jaccard：两句子分词后词语的交集中词语数与并集中词语数之比。Simhash：先计算两句子的simhash二进制编码，然后使用海明距离计算，最后使用两句的最大simhash值归一化得相似度。

答案解析

选2-3个传统的文本匹配算法说一下原理即可

14.怎么防止过拟合（猿辅导）

参考答案

1.获取和使用更多的数据（数据集增强）——解决过拟合的根本性方法

让机器学习或深度学习模型泛化能力更好的办法就是使用更多的数据进行训练。但是，在实践中，我们拥有的数据量是有限的。解决这个问题的一种方法就是创建“假数据”并添加到训练集中——数据集增强。通过增加训练集的额外副本来增加训练集的大小，进而改进模型的泛化能力。

2. 采用合适的模型（控制模型的复杂度）

过拟合主要是有两个原因造成的：数据太少+模型太复杂。所以，我们可以通过使用合适复杂度的模型来防止过拟合问题。

3.降低特征的数量

对于一些特征工程而言，可以降低特征的数量——删除冗余特征，人工选择保留哪些特征。这种方法也可以解决过拟合问题

4.结合多种模型

简而言之，训练多个模型，以每个模型的平均输出作为结果。比如bagging和boosting，都能很好的解决过拟合。

答案解析

这道题主要考验过拟合的概念及如何防止过拟合，过拟合是指训练误差和测试误差之间的差距太大。就是说模型复杂度高于实际问题，模型在训练集上表现很好，但在测试集上却表现很差。

15.xgboost rf不同（快手）

参考答案

1、随机森林采用的bagging思想，而xgboost采用的boosting思想。

2、组成随机森林的树可以并行生成；而xgboost只能是串行生成。

3、对于最终的输出结果而言，随机森林采用多数投票等；而xgboost则是将所有结果累加起来，或者加权累加起来。

4、随机森林对异常值不敏感；xgboost对异常值非常敏感。

5、随机森林对训练集一视同仁；xgboost是基于权值的弱分类器的集成。

答案解析

这道题主要是考察xgboost和随机森林的区别，只要能大致描述几个本质上的区别即可

#学习路径#

全部评论

推荐最新楼层

牛客549436921号

南京农业大学

多谢多谢，很全面！

点赞回复分享

发布于 2022-02-14 18:00

昨天 16:36

辽宁工程技术大学 C++

给牛友们释放一个京东offer

签了其他的了，今年就先不去东子做兄弟了，江湖再见

点赞评论收藏

11-18 22:59

暨南大学 HRBP

现在的同学找工作的想法真的很多

今天面试了一个00后的小女生，她对找工作的想法让我深有感触。她提到，除了基本工资，她希望公司能抗风险，稳定可靠。更重要的是，她渴望在这个平台上成长，而不是仅仅打卡上班，浪费时间。她说得对，大家其实都是在为未来的简历而努力。无论年龄，能清楚自己想要什么，选择手中拥有的机会，践行长期主义，才是最珍贵的。积极的态度和行动，才是我们求职路上最宝贵的财富。

无情咸鱼王的秋招日记之薛定谔的Offer：想法太多容易找不到工作，可能她不缺工作吧

牛客创作赏金赛

点赞评论收藏

11-02 09:49

已编辑

货拉拉_测试(实习员工)

终于收到了，秋招唯一面试，两天速通！

双飞本，有实习经历，终于可以躺平了，结束秋招！！

热爱生活的仰泳鲈鱼求你们别卷了：没事楼主，有反转

查看图片

点赞评论收藏

09-29 12:39

黑龙江科技大学 Java

大家避雷

垃圾公司，大家避雷，没见过上来就骂人的

去B座二楼砸水泥地：不过也可以理解，这种应该没参加过秋招

点赞评论收藏

11-18 11:13

已编辑

Columbia University 算法工程师

秋招终于到此结束

秋招，是一场大型持久战，我真的累了。。。在美留子一枚，上周四接到腾讯音乐的开奖电话了，50+W，应该是SSP，没有一丝犹豫的接了，很知足！更重要的原因是真的一点都面不动了，太内耗了，一开始还是我要干翻这个世界的状态，到后来，有个班上就行了。Timeline如下：8.19网申-8.23笔试-8.27初试-8.30复试-9.6面委-9.18hr面试-10.15意向-11.14开奖。没错，老娘已经订好了去冰岛的机票，要疯，要浪，要happy！ BG：9本QS50美硕，本硕都是学人工智能相关的，研究方向主要是推荐算法。其实想想，我也是挺卷的。人在美国，没有国内同学的实习便利，但又特别怕秋招简历上没有实...

拿到ssp可以么：有钱真好啊，有钱还拿到50w+真好啊，50w+还能wlb更好了，我要嫉妒到发疯了

你最想要的公司福利是？

点赞评论收藏

6 48 评论

招聘动态

字节跳动

2025校园招聘

杉川机器人

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #