记录阿里健康机器学习-算法岗位一面面经
因为是今天(2021.5.12)刚刚面完第一面,感觉真的是受到了洗礼,所以记录下来了,大厂的面试真的是全方面的,重在考察应聘实习生的基础知识能力,总共考察了以下几部分的知识:
1.概率论
2.线性代数
3.数据结构和算法
4.数据库
5.计算机操作系统
6.机器学习基本基础知识
7.深度学习常见问题
8.项目经历抠细节
9.一道简单笔试题
2021.3.29 阿里统一笔试,一个小时,两道算法题,一道oc,另一道看出来是一道可以利用弗洛伊德算法解决的题目,但是只写了一部分,没来得及写完。
过了漫长的一个月,自己应该是被捞起来,昨天(2021.5.11)收到面试预约电话,确定今天(2021.5.12)上午11点进行面试。
一面(总时长1小时10分钟左右)
自我介绍
询问自己是否以后想要留在阿里部门(确定留职意向)
开始正式面试:
1. 如果数据是0-1之间均匀分布,那么期望为0.5的概率是多少?(第一题就被问蒙了,没想到要考硬核数学基础,看来要恶补基础了)
在提醒过程中,几次出现微积分之类的操作,最后计算期望为0.5的概率等于0
2. 在一个圆周上任意取两个点,问这两个点之间的连线过圆心的概率是多少?
可以固定一个点,只存在一种情况使得两点连线过圆心,而连线的情况有无数种,则分母是一个无穷大,分子为1,则概率为0.
3. 在一个圆周上任意取三个点,问这三个点围成的三角形为钝角三角形的概率有多大?
后来想了想,大概是这个意思:
lo代表圆的周长,弧lAB占圆周长的比例就是为锐角三角形的概率,然后用1-p就是为钝角三角形的概率。
4. 线性代数中怎么定义特征向量,特征值的?
5. 你在机器学习哪个算法中用到了特征向量或者特征值?
6. 二分查找的时间复杂度是多少?
7. 二分查找的空间复杂度是多少?
为什么二分查找的空间复杂度是logn,试着解释一下?(因为需要二分和递归实现,所以需要依赖二叉树+栈)
8. 快速排序时间复杂度是多少?空间复杂度是多少?
快排的空间复杂度试着解释一下?(快排最坏情况,二叉树深度是多少?最好情况二叉树深度是多少?)
9. 数据库中索引是依赖什么数据结构?(忘完了快)
10. 操作系统中,当进入子函数,电脑做了什么操作(保护数据并能在子函数返回后能还原,具体做了什么工作呢?)
11. 机器学习中有没有遇到过过拟合?为什么会过拟合?怎么处理过拟合?
12. 数据分布情况会不会产生过拟合?
13. 机器学习中,你能简单区分一下,bagging 和 boosting 方法吗?
14. 随机森林中的如果是决策树,决策树是怎么构建的?
15. boosting是不是比bagging更容易过拟合?
16. 深度学习有没有用到归一化?用到了什么归一化?归一化的操作是什么?有什么作用?
17. 激活函数用到了什么激活函数?他们区别是什么?
18. Relu 和 sigmoid 函数相比优势在哪?
19. LeakyRelu 比 Relu 的优势又在哪?
20. 深度学习中你用到的损失函数有什么?
21. log损失函数你见过除了交叉熵以外的还有其他的损失函数吗?
22. 项目当中:简单说一下你自己的项目背景,用到了什么方法,怎么想的?
23. 数据规模有多大?
24. 怎么做嵌入的?
25. 算法题:
给一个有序数组,可能有重复数字,给一个数字,需要实现在这个数组中找到这个数字,如果找到则返回下标,如果找不到则返回-1,如果有重复数字只需要返回任意其中一个数字的下标即可。
要求用二分查找写,不能用递归的方式实现。
用下标标记首尾下标,首为first,尾为last
当first <= last 时进行循环,每次都是计算mid,mid所指的值如果大于目标值,则last移动到mid前一位,mid所指的值如果小于目标值,则first移动到mid后一位,接着循环,直到mid所指的值等于目标值,则输出mid,否则循环体外输出-1
果然有人说被大厂面试一次就是学习一次,真的是感受到了。