那就开摆258 level
获赞
152
粉丝
18
关注
6
看过 TA
989
中国科学技术大学
2025
深度学习
IP属地:安徽
暂未填写个人简介
私信
关注
刚面完估计凉,趁着还记得写写论文项目实习穿插八股llama系列介绍下大模型训练流程说下lora介绍下rope为什么都不用正余弦编码了(感觉他不满意,说了相对位置编码优点,可学习的一些,最后硬说效果不好哈哈)为什么要sft,试过么,调得什么包,做过rf么,无通用的sft和业务的sft有什么区别为什么gpt的少量多语言数据,多语言能力也很好,如何提高?(说了跨语言,多语言对齐做些nlu翻译任务和llama的少量微调,没答到他心趴上)对比学习主要难点sft和rf之后哪个模型的多样性更好(我说rf之后,他说不对反了,我又改口,刚刚搜gpt,gpt和我的观念和思路一样😡,所以到底是啥)如何提高回答的多样性(说了温度,数据,多任务,数据加噪,又没答到心趴😡,我自己觉得挺对的)手撕 18,四数之和,按照三数之和双指针写的,最后有点有个if的判断条件写错了没查到,给了感觉就20分钟,就说时间到了,我说我马上就写出来,他说但是时间到了,我说我思路肯定没问题,他说先不关心这些,问我有啥要问他的知道无望了就问了评价一下表现,说这个代码能力是基础就不用讲了(那你也给多我点时间我找找bug呀,也没问我写的啥思路),说我大模型的了解一般(这个我认可),总得来说体验一般 ,本来就不太想去哈哈哈对了,我还问他主要做啥,她说现在也没啥业务,主要还是整数据train basemodel,我说那就是进去做数据工程喽哈哈,评价不如打游戏一小时 #牛客创作赏金赛#
查看12道真题和解析 牛客创作赏金赛
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务