百度 实习 大模型 一面
这次面试的问题都比较有意思,记录一下:
1、介绍一下之前工作的业务场景(code LLM)
2、你微调过这么多不同家的大模型(LLama、Qwen、codellam、mistral等),都有什么区别(在业务上,并不是八股结构)
3、在业务上比较有效的微调手段
4、具体代码翻译场景下,遇到的两种不同语言的函数不能完全一致对应,该用什么方法解决。
我提出说用一些RAG可以解决
5、使用工程手段解决4好,还是使用SFT解决4好,
6、如何进行5的SFT
我认为这是一个较难的问题,还是说之前在工作的时候是使用RAG解决的,此外又讲了一些在数据构造上的手段和prompt上的手段
7、面试官认为可以使用RLHF解决(似乎他没有完全理解我说的业务场景)
讲了使用DPO的做法
8、讲一下DPO、PPO、GRPO、KTO
其他的讲了,不了解KTO
8.5、为什么不考虑对Base直接做DPO
9、问DPO的数据如何构造
10、问RAG问题的痛点在哪里、优点在哪里
11、是否了解COT
讲了另外一段NLP实习做的COT的经历
11.5、问COT从数理逻辑上为什么奏效
12、问之前具体负责了哪些工作,是否具体做过训练的内容
表明做过(正常流程下面要问DeepSpeed了,但并没有问)
13、问Attention上都有哪些优化措施
把GQA和FlashAttention搞混了
好像这次面的比较差,可能要挂,来攒攒人品
1、介绍一下之前工作的业务场景(code LLM)
2、你微调过这么多不同家的大模型(LLama、Qwen、codellam、mistral等),都有什么区别(在业务上,并不是八股结构)
3、在业务上比较有效的微调手段
4、具体代码翻译场景下,遇到的两种不同语言的函数不能完全一致对应,该用什么方法解决。
我提出说用一些RAG可以解决
5、使用工程手段解决4好,还是使用SFT解决4好,
6、如何进行5的SFT
我认为这是一个较难的问题,还是说之前在工作的时候是使用RAG解决的,此外又讲了一些在数据构造上的手段和prompt上的手段
7、面试官认为可以使用RLHF解决(似乎他没有完全理解我说的业务场景)
讲了使用DPO的做法
8、讲一下DPO、PPO、GRPO、KTO
其他的讲了,不了解KTO
8.5、为什么不考虑对Base直接做DPO
9、问DPO的数据如何构造
10、问RAG问题的痛点在哪里、优点在哪里
11、是否了解COT
讲了另外一段NLP实习做的COT的经历
11.5、问COT从数理逻辑上为什么奏效
12、问之前具体负责了哪些工作,是否具体做过训练的内容
表明做过(正常流程下面要问DeepSpeed了,但并没有问)
13、问Attention上都有哪些优化措施
把GQA和FlashAttention搞混了
好像这次面的比较差,可能要挂,来攒攒人品
全部评论
过了没佬,度一面就这么猛,是文心部门吧,真卷
相关推荐

点赞 评论 收藏
分享
点赞 评论 收藏
分享