【25暑期实习】商汤科技多模态二面
首先申明,这次面试官也很温柔,甚至感觉有点i呢,但面试过程略显尴尬,对st不做更多评价。
面试时间55分钟,没有写代码。面了一趟下来很多很多问题都忘了,因为不熟…回忆版面试题如下:
1. 不用开摄像头。
2. 自我介绍(开始前提示是算法岗,别介绍太多开发工作)
3. 开始介绍他们的工作内容
4. 我反问:你跟一面面试官不是一个组吗? 面试官答:你已经一面过了吗?(开始反应过来莫名其妙被不明来历的一面拷打,面试内容可见前几天的面经)
下面是正式面试过程
问的问题太碎了太碎了,而且面试官也在想要怎么问^ - ^
5. 项目经历问了很久,面试官是做多模态的,对llm不是很懂(我也不知道怎么进这个组的面试了)
6. 问题集中在diffusionc model,stylegan,因为项目用了这个,他问为什么用stylegan,这么老的模型,问了些细节,真回忆不起来了。
7. unet,resnet,clip都问了一下…主要是都没回答好。
8. lora具体是怎么实现的,一般训哪些参数?
9. p-tuning v1/2问了下细节
10. llama的loss函数
11. 用没用过DDP和deepspeed,有什么区别
12. 多分类任务如果发现都分到了一个label,怎么排查原因,怎么解决,数据不均匀怎么办,不改数据集pytorch代码怎么改?
13. 常见的位置编码知道哪些?图像怎么处理?超过长度怎么办?padding?截断?
14. transformer结构讲一下
15. 给你text讲一下转成embedding的流程
16. clip的位置编码,好像问了怎么外推
17. 有没有自己实现过dataload?
…其他的想不起来了就这样吧
自由提问
1. 组里后面的工作计划,面试官好像也不太清楚
2. 想篇research,组里有实习生纯research,有一半一半的
3. 问我对这个工作感不感兴趣,因为不完全是llm
4. 他们之前只用过llama2,又说现在换了个更好的,但是没想起来是啥,也只是微调了一下
5. 没啥想问的,确实没很大兴趣。
面试时间55分钟,没有写代码。面了一趟下来很多很多问题都忘了,因为不熟…回忆版面试题如下:
1. 不用开摄像头。
2. 自我介绍(开始前提示是算法岗,别介绍太多开发工作)
3. 开始介绍他们的工作内容
4. 我反问:你跟一面面试官不是一个组吗? 面试官答:你已经一面过了吗?(开始反应过来莫名其妙被不明来历的一面拷打,面试内容可见前几天的面经)
下面是正式面试过程
问的问题太碎了太碎了,而且面试官也在想要怎么问^ - ^
5. 项目经历问了很久,面试官是做多模态的,对llm不是很懂(我也不知道怎么进这个组的面试了)
6. 问题集中在diffusionc model,stylegan,因为项目用了这个,他问为什么用stylegan,这么老的模型,问了些细节,真回忆不起来了。
7. unet,resnet,clip都问了一下…主要是都没回答好。
8. lora具体是怎么实现的,一般训哪些参数?
9. p-tuning v1/2问了下细节
10. llama的loss函数
11. 用没用过DDP和deepspeed,有什么区别
12. 多分类任务如果发现都分到了一个label,怎么排查原因,怎么解决,数据不均匀怎么办,不改数据集pytorch代码怎么改?
13. 常见的位置编码知道哪些?图像怎么处理?超过长度怎么办?padding?截断?
14. transformer结构讲一下
15. 给你text讲一下转成embedding的流程
16. clip的位置编码,好像问了怎么外推
17. 有没有自己实现过dataload?
…其他的想不起来了就这样吧
自由提问
1. 组里后面的工作计划,面试官好像也不太清楚
2. 想篇research,组里有实习生纯research,有一半一半的
3. 问我对这个工作感不感兴趣,因为不完全是llm
4. 他们之前只用过llama2,又说现在换了个更好的,但是没想起来是啥,也只是微调了一下
5. 没啥想问的,确实没很大兴趣。
全部评论
oc了?
大佬之前在哪边实习呀
所以llama的loss函数是什么呀,好像真的找不到耶
相关推荐
11-19 12:10
湖南财政经济学院 Java 点赞 评论 收藏
分享