得物日常实习一面记录
1.我说最感兴趣的是多模态大模型,面试官说他们做的是业务,不会预训练大模型,怕我不感兴趣(我说我就是想做多模态的业务)。先介绍了组的业务,大概是内容理解和治理,涉及到的模态有图像/文本/视频等。(因为我一直在强调不想做单纯的图像任务,因为考虑到校招的难度,想过度到多模态)
2.深挖字节电商内容治理的实习(做的基本是图像的任务)训练过程,基于llava的VQA为什么比直接分类好?prompt的作用
3.多头注意力,focal loss
4.求一个数的平方根
5.反问:会不会只做图像?业务数据规模有多大(大概几百万)?如果过了,学校还有事一个月后再入职行不行。
得物离学校特别近(这样老师找我就能马上回来啦),许愿能过。面试下来,是能感觉到面试官的技术深度和业务经验的。