微软LLM实习

部门:微软亚洲研究院 NLC(genai组)
职责:
       参与大模型训练所需数据的爬取工作
要求:
        1. 熟练掌握深度学习和自然语言处理相关技术以及相关工具。
        2. 优先考虑拥有爬虫经验和反爬虫经验的同学。
        3. 有良好的工程化经验,Coding能力出色,能处理大规模数据。
        4. 能担保至少 6 个月的实习期。

福利待遇:
        1. 完成度高的项目有机会发表学术论文或成为开源项目的一部分
        2. 国内领先的实习生待遇,弹性工作时间
        3. 与一流研究小组和研究员共同完成项目的机会

简历投递: v-lingjiang@microsoft.com

通用人工智能组的相关工作:
https://thegenerality.com/agi/
https://github.com/microsoft/unilm
https://github.com/microsoft/LMOps
https://github.com/microsoft/BitNet
 

#实习#  #内推#  #微软#  #NLP算法实习生#  #大模型实习#
全部评论
简历可以直接发邮箱,有问题也可以私聊我哦~
点赞 回复 分享
发布于 2024-12-16 14:38 北京

相关推荐

2024-12-18 12:59
已编辑
中国科学技术大学 深度学习
刚面完估计凉,趁着还记得写写论文项目实习穿插八股llama系列介绍下大模型训练流程说下lora介绍下rope为什么都不用正余弦编码了(感觉他不满意,说了相对位置编码优点,可学习的一些,最后硬说效果不好哈哈)为什么要sft,试过么,调得什么包,做过rf么,无通用的sft和业务的sft有什么区别为什么gpt的少量多语言数据,多语言能力也很好,如何提高?(说了跨语言,多语言对齐做些nlu翻译任务和llama的少量微调,没答到他心趴上)对比学习主要难点sft和rf之后哪个模型的多样性更好(我说rf之后,他说不对反了,我又改口,刚刚搜gpt,gpt和我的观念和思路一样😡,所以到底是啥)如何提高回答的多样性(说了温度,数据,多任务,数据加噪,又没答到心趴😡,我自己觉得挺对的)手撕 18,四数之和,按照三数之和双指针写的,最后有点有个if的判断条件写错了没查到,给了感觉就20分钟,就说时间到了,我说我马上就写出来,他说但是时间到了,我说我思路肯定没问题,他说先不关心这些,问我有啥要问他的知道无望了就问了评价一下表现,说这个代码能力是基础就不用讲了(那你也给多我点时间我找找bug呀,也没问我写的啥思路),说我大模型的了解一般(这个我认可),总得来说体验一般 ,本来就不太想去哈哈哈对了,我还问他主要做啥,她说现在也没啥业务,主要还是整数据train basemodel,我说那就是进去做数据工程喽哈哈,评价不如打游戏一小时 #牛客创作赏金赛#
查看12道真题和解析 牛客创作赏金赛
点赞 评论 收藏
分享
评论
点赞
3
分享
牛客网
牛客企业服务