算法实习面经汇总
百度 一面
1. 比赛的特征工程怎么做的?
2. 为什么用XGB做融合?
3. 1w多条数据,XGB的参数怎么调啊?
4. 训练了多少棵树?
5. 有没有出现过拟合出现?
6. 欠拟合和过拟合?
7. 解释为什么数据不做任何处理会导致模型过拟合?
8. 讲一下XGB
9. 树模型的剪枝算法,完整剪枝流程
10. 剪枝的指标,是什么依据
11. L1和L2正则化
12. 讲一下Bagging
13 . RF跟XGB哪个更深?
13. LR里面做归一化、离散化之类的好处
14. LR的损失函数
15. 牛顿法、拟牛顿法
16. LR除了用梯度下降,还可以用牛顿法,矩阵是可逆的(优点)
百度 二面
1.java和python的区别
2 java 垃圾回收机制(可以讲一下python垃圾回收机制)
3 项目内容(介绍项目整体框架,有多少人员。我的分工,讲一下tf-idf和textrank,停用字出现的问题-不是很准确,对transformer和bert那些有多少了解)
4 论文是不是跟项目有关的?(答不是,偏理论,因此没有聊下去)
算法题:数组里面找和为s的所有子序列,不可重复(复杂度是多少?)
8.1 寒武纪 深度学习solution工程师 一面
Python多进程怎么实现?
Python 元组和列表的区别?
元组怎么转列表?(list直接转换就好)
Python GIL
Linux命令?
Shell脚本怎么传递参数?(美元符合后面跟着的数字就是参数了,)
CNN卷积后fearture大小怎么计算?乘法和加法计算了多少次?
过拟合欠拟合?
有哪些损失函数?
算法题:最大矩形面积
介绍简历上所有项目
1 用到了哪些激活函数
2 激活函数的作用?不要激活会怎样?
3 什么是反向传播?
4 梯度下降的缺点
1 列表去重几种方法
2 zip方法
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。
3 怎么找中位数
4 机器学习完整流程是怎么样的?
5 特征选择的方法?
6 过拟合方法?
7 二分类评价指标
8 类别不平衡解决方法
9 调哪些XGB的参数效果明显?
10 问题相似度的计算方法有哪些?
#实习##算法工程师##面经##百度##英伟达##小鹏汽车#