2023暑期实习-美团计算机视觉工程师面经

美团的IoT视觉组,主要是做基于监控数据的人物交互感知,技术栈基本也是检测、跟踪和人体关键点检测之类的

  1. 介绍之前的实习工作,多任务平衡怎么做的(数据和loss都调参),有没有学术上的解决方案(一般都会问这个)
  2. 自动驾驶的检测模型有没有根据一些corner case做一些针对性优化
  3. 密集行人场景存在遮挡有什么好的解决方案
  4. 这种遮挡情况下对跟踪的影响
  5. 神经网络的注意力机制
  6. 代码题:翻转二叉树

聊的整体还可以,可能的方向和内容比较match,下午就发二面邀请了

#软件开发2023笔面经##美团##计算机视觉#
全部评论
是自己训练数据,自己跑吗?
1 回复 分享
发布于 2023-03-16 20:15 四川
楼主牛逼
点赞 回复 分享
发布于 2023-03-15 23:52 北京
视觉算法需要重点学习哪些方面呢
点赞 回复 分享
发布于 2023-03-16 20:18 湖北
一看就是康老师的学生
点赞 回复 分享
发布于 2023-03-19 20:08 广东
大佬有论文吗?我也投了算法岗但是没论文只有一段时间比较短的实习,怕面试直接挂了
点赞 回复 分享
发布于 2023-03-19 20:41 上海
计算机视觉的朋友看看我,我这边招人😆
点赞 回复 分享
发布于 2023-03-28 21:48 浙江
老哥总共有几面啊 我也是面的iot
点赞 回复 分享
发布于 2023-04-03 18:29 广东
想问下老哥业务复试总共有几轮啊?然后是三轮+hr面么,还是hr面包括在三轮面试里了呢
点赞 回复 分享
发布于 2023-04-10 11:43 北京
请问多任务融合当中数据和loss都调参是什么意思呢?这个数据调参指什么?
点赞 回复 分享
发布于 2023-05-25 09:10 北京
base哪里啊
点赞 回复 分享
发布于 2023-11-01 15:49 湖南

相关推荐

2024-12-31 18:58
抖音视界_算法工程师
面向2026届硕士/博士毕业生团队介绍:Data-电商基建团队,负责电商场景下的各种基础模型的研发与创新工作。职位描述:1、多模态大模型算法研发:负责电商场景下,图文,图视频,音频,OCR,口播等多个模态的预训练和对齐,产出多模态大模型的统一底座,用于电商治理场景所有多模态需求使用。2、基础算法研发:负责CV/多模态相关模型优化和迭代,视频预训练,视频标签体系建设,视频多模态语义识别,多模态表征学习,embedding等,用于包含视频意图理解、视频商品类目、同款/相似商品识别、图文意图判断等电商任务。3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率。职位要求:1、 有过大模型业务实习经历优先,熟悉大模型/多模态大模型工作优先,包括但不限于internvl, llava系列, deepseekvl等等等;2、在多媒体和计算机视觉某个领域有较深入的研究,包括但不限于:图像搜索、图像/视频分类和识别、目标检测、图文多模态模型、和视频文本多模态模型、视频预训练、视频语义标签等;3、有视频理解多模态大模型方面经验者最优先,有CV/多模态大模型相关项目经验优先;研发&优化电商视频&商品多模态大模型,结合LLM和视频/商品表征,支持视频多模态分类,视频QA,跨模态检索,商品分类等任务,显著超越线上模型;4、有较强的实践能力,在Kaggle,COCO,ImageNet,ActivityNet等比赛获奖者优先;5、扎实的深度学习技术基础,了解前沿的AI技术,有顶级学术会议(如CVPR、ICCV、ECCV等)发表论文者优先。有转正机会,有兴趣可私聊或发送简历到zhangxuezhong@bytedance.com#字节# #实习# #多模态大模型招聘#
投递字节跳动等公司8个岗位
点赞 评论 收藏
分享
01-01 15:17
已编辑
华东师范大学 C++
点赞 评论 收藏
分享
评论
5
34
分享

创作者周榜

更多
牛客网
牛客企业服务