一进面试房间就开始撕题,两道mid:合并区间、最长递增子数组+按最小字典序输出最长子序列,要求两道20分钟内必须写出来,幸亏刷过,不然碰到新题肯定g。自我介绍。开始问一系列大模型深层次的问题,我觉得我属实被问蒙了。。。做大模型SFT遇到的问题,分类问题中如果出现输出未匹配标签的情况怎么办?介绍Belle和ChatGLM,两者的主要区别是什么?ChatGLM这么做有什么好处和坏处?怎么训练的大模型,DeepSpeed Zero三个状态是什么,哪个部分参数量更大一些?是否用过多机多卡,DeepSpeed使用多机多卡有什么问题?提问。我才知道为什么面试邀约类型是实习了,原来WXG要冬季实习才能转正,...