腾讯 TEG AI LAB 大模型一面

面感不错,业务比较匹配。。。没想到现在做拟人对话的这么多。
1.自我介绍
2.详细介绍了商汤实习项目(感觉又被套了方案)
针对项目的一些提问
1.有没有用过 GPT 之类的模型对你们的数据进行打分评价?
2.有没有考虑训练一个奖励模型去评价你们的数据
(感觉可能是他们的一些方案遇到了问题)
3.介绍一下 DPO 和 PPO
4. PPO 有几个模型(4 个,但是我没记起来评论模型,说我想不起来这个名字了,其实具体训练细节也忘记了)
5.DPO的 loss 公式记得吗(确实不记得)
6. rag 和 sft 的区别(这两不是一个维度的啊,就大概讲了一下自己的理解,应该没啥问题)
7.Transformer 结构。(从头到尾仔细说了一遍)

代码题
最长回文子串

反问发现业务几乎一样,难怪项目问那么细致
整体而言就是 RLHF 两个知识点没回答好,感觉问题应该不太大。
全部评论
佬,你几天被捞的啊
点赞 回复 分享
发布于 08-21 21:11 北京
笑死,套方案可还行
点赞 回复 分享
发布于 08-26 18:42 北京
佬,有这个hr的联系方式吗
点赞 回复 分享
发布于 09-04 20:56 北京

相关推荐

ArisRobert:统一解释一下,第4点的意思是,公司按需通知员工,没被通知到的员工是没法去上班的,所以只要没被通知到,就自动离职。就是一种比较抽象的裁员。
点赞 评论 收藏
分享
牛客5655:其他公司的面试(事)吗
点赞 评论 收藏
分享
9 20 评论
分享
牛客网
牛客企业服务