腾讯 TEG AI LAB 大模型一面
面感不错,业务比较匹配。。。没想到现在做拟人对话的这么多。
1.自我介绍
2.详细介绍了商汤实习项目(感觉又被套了方案)
针对项目的一些提问
1.有没有用过 GPT 之类的模型对你们的数据进行打分评价?
2.有没有考虑训练一个奖励模型去评价你们的数据
(感觉可能是他们的一些方案遇到了问题)
3.介绍一下 DPO 和 PPO
4. PPO 有几个模型(4 个,但是我没记起来评论模型,说我想不起来这个名字了,其实具体训练细节也忘记了)
5.DPO的 loss 公式记得吗(确实不记得)
6. rag 和 sft 的区别(这两不是一个维度的啊,就大概讲了一下自己的理解,应该没啥问题)
7.Transformer 结构。(从头到尾仔细说了一遍)
代码题
最长回文子串
反问发现业务几乎一样,难怪项目问那么细致
整体而言就是 RLHF 两个知识点没回答好,感觉问题应该不太大。
1.自我介绍
2.详细介绍了商汤实习项目(感觉又被套了方案)
针对项目的一些提问
1.有没有用过 GPT 之类的模型对你们的数据进行打分评价?
2.有没有考虑训练一个奖励模型去评价你们的数据
(感觉可能是他们的一些方案遇到了问题)
3.介绍一下 DPO 和 PPO
4. PPO 有几个模型(4 个,但是我没记起来评论模型,说我想不起来这个名字了,其实具体训练细节也忘记了)
5.DPO的 loss 公式记得吗(确实不记得)
6. rag 和 sft 的区别(这两不是一个维度的啊,就大概讲了一下自己的理解,应该没啥问题)
7.Transformer 结构。(从头到尾仔细说了一遍)
代码题
最长回文子串
反问发现业务几乎一样,难怪项目问那么细致
整体而言就是 RLHF 两个知识点没回答好,感觉问题应该不太大。
全部评论
佬,你几天被捞的啊
笑死,套方案可还行
佬,有这个hr的联系方式吗
相关推荐
10-18 21:51
西安电子科技大学 C++ 点赞 评论 收藏
分享