商汤-22领航员/CV研究员-面经(已意向)
9.29收到意向书
7.30 一面 48min
- 实际训练模型时往往是以mini-batch的形式向网络中输送数据。但如果不考虑内存以及计算速度的问题,一次性把所有训练数据都送入到网络并计算loss的方式可行吗?
- 如何抑制过拟合?
- 介绍下L1、L2正则
- 介绍下dropout,为何dropout能够抑制过拟合?
- 介绍下BatchNorm。BN在训练和测试阶段各有什么不同?记录全局均值和方差时如果单纯进行算数平均可行吗?
- 对于BN,如果不在训练过程中记录全局均值和方差,而是在训练完成后统一将全部训练样本依次输入网络,一次性得到全局均值和方差,这种方法可行吗?
- 给定一个大小为(N、C、H、W)的tensor,则BN在计算其单个batch的均值和方差时是按照哪个维度进行的?
- 如果将C、H、W所在的特征维度全部用于独立计算均值和方差可行吗?会出现什么问题?
- 介绍下pytorch里的dataset、dataloader、sampler
- 在复现paper时,可能需要将tf代码转换为torch。如果指标发生了劣化,如何定位、排查问题?
- 介绍一个最能体现你个人学习能力的经历
- 反问。
8.3 二面 1h
- 自我介绍
- 介绍文章内容,和面试官探讨了很多算法思路及其衍生问题,泛用性不强所以就不展开介绍了
- 样本不均衡该如何处理?
- 常用的聚类方法都有哪些?
- 编程题:实现一个 k-means 算法
8.10 三面 40min
- 介绍文章内容
- 介绍专利内容
- 是否了解混合高斯模型?
- 常见的降维方法都有哪些?
- 聊聊小样本领域的一些研究进展
- 反问
9.3 HR面 15min
- 自我介绍
- 实习期间的收获有哪些
- offer情况
- 如何选择offer
- 可接受的工作地点有哪些
- 反问