字节多模态一面折磨经

全程不问基础知识,不问简历,开放性问题探讨,总时长1.5h。
问:看你做的是vqa,那么请你发散性说一下如果针对一个视频怎么做vqa
答:抽帧采样,时间序列拼接token...
问:视频,语音,文本怎么多模态融合
答:cross attention
问:不用attention实现融合
答:3D卷积
问:transformer里不用attention实现融合
答:misture of experts
问:视频前后帧怎么融合
bulabulabula,每一个方案都要从输入开始描述每一步处理过程,他会一点点给你提这个方案现有的问题,如何解决,就算答不会了面试官也会继续说他的观点让你补充,后面基本全程懵逼,智商被碾压。
最后给了一道hard结束。
面试官态度很好,但是过程很折磨,是智商被碾压的折磨。面完感觉像参加了圆桌会议。虽然没挂但是已经不想继续面了,诚心感觉水平配不上#字节实习生##字节算法实习##多模态##暑期实习##算法面经#
全部评论
1.5h的面试,这么长时间吗?
点赞 回复 分享
发布于 2023-04-08 22:54 四川
字节有群面吗?
点赞 回复 分享
发布于 2023-04-08 22:57 广东
字节好难啊
点赞 回复 分享
发布于 2023-04-26 02:24 上海

相关推荐

不愿透露姓名的神秘牛友
今天 10:25
点赞 评论 收藏
分享
点赞 评论 收藏
分享
4 27 评论
分享
牛客网
牛客企业服务