腾讯wxg NLP一面
- 一进面试房间就开始撕题,两道mid:合并区间、最长递增子数组+按最小字典序输出最长子序列,要求两道20分钟内必须写出来,幸亏刷过,不然碰到新题肯定g。
- 自我介绍。
- 开始问一系列大模型深层次的问题,我觉得我属实被问蒙了。。。
- 做大模型SFT遇到的问题,分类问题中如果出现输出未匹配标签的情况怎么办?
- 介绍Belle和ChatGLM,两者的主要区别是什么?ChatGLM这么做有什么好处和坏处?
- 怎么训练的大模型,DeepSpeed Zero三个状态是什么,哪个部分参数量更大一些?
- 是否用过多机多卡,DeepSpeed使用多机多卡有什么问题?
- 提问。我才知道为什么面试邀约类型是实习了,原来WXG要冬季实习才能转正,不能直接秋招发offer(不知道其他事业群是不是这样),麻了,给我打击完了,wxg确实难。