23秋招 阿里高德部门机器学习 面经
更新:已挂
9月1号投递的算法工程师-机器学习岗,高德部门
9.5一面 (50min)
总结:面试分四部分:简历项目+基础知识+场景题+做题
- 自我介绍
- 简历项目比赛介绍+提问
- 问了许多深度学习和机器学习的基础知识:
- 卷积 vs 全连接
- 怎么理解卷积?
- 图片的物体发生位移或扰动,对CNN有影响吗?
- 池化的作用
- 随机森林 vs GBDT
- 随机森林和GBDT的基分类器可以改成线性分类器或者其他吗?
- 分类问题的损失函数CE(交叉熵)可以换成MSE吗?
- MSE有一致性(预测值的均值与真实值的均值接近一致),CE有一致性吗?
- 已知一个模型在测试集上的偏差较大、方差较小,分析原因并解决
- 暂时只能想起来这么多。。。
- 场景题:用户从一个起点打车到终点,如何为用户推荐上车点?给出上车点的定义,问题的定义,以及如何利用各种信息建模来给出上车点。已知用户的各种历史信息包括历史打车的信息、偏好上车点等等
- 概率论题:已知某种罕见病的检测准确率是98%,实际人群中患病概率为x,小张某天去医院检测该病为阳性,那么他实际患病概率是多少?
- 算法题:没有测试用例,只需要写代码就行。
- 输入一个数组x,求最大的差值 xi-xj(i<j),要求用O(n)的时间复杂度。
- 反问
9.22二面 (1h)
总结:面试分四个部分:研究方向+项目提问+基础知识+场景题,无手撕
- 自我介绍
- 研究方向提问
- 项目提问
- 问了一些基础相关的问题:
- 讲一下LSTM内部结构
- 讲一下GRU内部结构,相比LSTM有什么不同?
- XGBoost在构造每棵树时,优化目标是什么?相比GBDT算法上的不同?
- 梯度消失有哪些解决办法?
- 有一些输入的图片,想学习旋转不变性,有什么办法?(回答了加池化,面试官说池化不是网络必需的,有没有别的办法,不太明白他想问还有什么办法,数据增强吗?)
- 已知有一个数据集线性可分,用LR训练会收敛吗?(应该是不会收敛,参数会越来越大)
- 一个开放性或者说是数学问题:
- 已知平面上5个点,如何求离这5个点欧氏距离之和最近的点?答:可以用蒙特卡洛模拟,在5个点组成的闭包里采样足够多的点,距离之和最小的应该就是近似解。面试官:这个是可以,能算出它的收敛速度吗?答:不会。。。面试官:这个收敛很慢,有没有收敛速度是根号n分之一的方法?答:不会。。。(下来查了相关的问题,一个相关的链接贴在这 )
- 场景题:
- 高德打车相关,app每天为用户推送一个打车的广告来促使用户使用高德打车,现在采取的笨方法是每天固定的时间推送一次,比如早上8点,但这个时间用户可能已经打过车了。设计一个算法,以及用到哪些数据或特征,为每个用户每天提供个性化的推荐时间,每个用户每天还是推送一次。
- 反问了业务以及面试流程,如果通过可能还有一轮技术面和一轮HR面