腾讯&旷视 计算机视觉实习生面经
腾讯视频 pcg
一面 40min
算法题:
回文字符串的判断
字符串中最长的回文串(暴力写了一个o(n3)的,然后动态规划不知道怎么 初始化讲了思路)
面试:
介绍项目,介绍ATSS的方法和改进;描述yolo的改进;fcos和centernet的实现(不是自己实现的所以一笔带过)
二面 50min
算法题 写了20min:
字母赋值求和 (一点思路都没有,面试官提供思路,实现之后再对边界问题进行了实现)
面试:
介绍项目,介绍ATSS然后对ATSS的看法和怎么改进(这里对ATSS存在的问题进行详细的讨论,主要讨论我发现的);为什么做项目里这种模型形式
问问题:
可不可以线上,主要做什么业务,实习生做什么
三面 40min
算法题:
多个有序数组 合并成一个 有序数组
面试:
- 讲讲项目和实习上的东西
- 聊了一下yolo系列的变化和改进
- 场景题: a. 从零到有构建一个可以在视频检测目标的模型,包括使用什么模型,怎么获取label等等。 b. 给一张人脸在多个视频中索引,如何考虑侧脸或者遮挡导致的不精确的问题?
- 讲讲梯度爆炸和梯度消失,我说bn和resnet都可以解决。面试官问resnet怎么解决,这里答的不好。自己感觉主要是解决梯度消失的问题
问问题:
我认为目标检测的精度有点接近瓶颈了,公司里会更加注重部署这块的么?比如模型压缩或者写自己的算子服务模型之类的?
HR面试 30min
整体就是随便聊,但是总得来讲很正式
自我介绍
说说自己的实习经历,最大的挑战
如何评价自己
简单的一些背景调查
总结
这是腾讯面的第二个部门,在流程上正式一些,直接在官网上拉进了面试流程。(第一个直接邮件通知)
但是体验上有时候会一般般,比如二面的时候没交流直接定了面试的时间,不过最后我说不合适就改了。三面的时候恰巧下午赶飞机,面试官迟到了半小时心里有情绪,在场景题上则基本自己发挥,面第一个部门的时候面试官会和我交流交换一些思路,那时候更像讨论问题,更喜欢一些。
旷视
- 聊项目
- 提出repvgg的动机是什么?为什么repvgg量化的效果特别差?
- ssd,yolo,fcos, atss等assign形式描述一下
- 写一个fpn的伪代码
- 链表删除重复的值
腾讯音乐 一面&二面
有什么防止过拟合的操作
样本不均衡该怎么解决
yolo有什么改进
讨论了一下yolof
场景题:
- 如何将歌曲推荐给用户:可以询问需要什么数据然后慢慢回答
- 如何分类一个短视频是否优质
给定一个数组,求和最大的连续子数组