淘天淘宝直播大模型实习一面
📖面试问题:#找实习#(4.9)
Q1:简单介绍一下在研究生期间的科研和实习经历。
Q2:介绍一下简历上那个完整的大模型项目。
Q3:做这个项目的背景,做项目的动机。
Q4:第三个项目是实习项目吗?
Q5:对第1个项目有用NER的方法吗?微调前base模型的准确率是多少?
Q6:第2个项目的数据集构造是不是有问题?这些数据的判断是不是对大模型来说太简单了?
Q7:有用传统方法来测你构造数据集的有效性吗?比如用BERT
Q8:介绍一下Lora的原理。
Q9:LORA基于什么问题,什么样的模型可以用LORA进行微调?什么是低秩分解?
Q10:LORA的初始化方法。
Q11:两个权重矩阵的初始化。
Q12:项目中的可解释性模块是什么?
Q13:介绍一下Int8和FP32的区别是什么?
Q14:Int8的表示范围。
Q15:Int8和FP32前向计算的区别。
Q16:除了大模型,你对推荐系统,CV模型有了解吗?
手撕代码:lc82. 删除排序链表中的重复元素 II
反问:
做什么业务(淘宝直播生态和主播智能手卡)
进组后做什么业务(预训练)
🙌面试体验:挺好的,注重业务,八股并不多。
Q1:简单介绍一下在研究生期间的科研和实习经历。
Q2:介绍一下简历上那个完整的大模型项目。
Q3:做这个项目的背景,做项目的动机。
Q4:第三个项目是实习项目吗?
Q5:对第1个项目有用NER的方法吗?微调前base模型的准确率是多少?
Q6:第2个项目的数据集构造是不是有问题?这些数据的判断是不是对大模型来说太简单了?
Q7:有用传统方法来测你构造数据集的有效性吗?比如用BERT
Q8:介绍一下Lora的原理。
Q9:LORA基于什么问题,什么样的模型可以用LORA进行微调?什么是低秩分解?
Q10:LORA的初始化方法。
Q11:两个权重矩阵的初始化。
Q12:项目中的可解释性模块是什么?
Q13:介绍一下Int8和FP32的区别是什么?
Q14:Int8的表示范围。
Q15:Int8和FP32前向计算的区别。
Q16:除了大模型,你对推荐系统,CV模型有了解吗?
手撕代码:lc82. 删除排序链表中的重复元素 II
反问:
做什么业务(淘宝直播生态和主播智能手卡)
进组后做什么业务(预训练)
🙌面试体验:挺好的,注重业务,八股并不多。
全部评论

算法岗?要不要看看我们这里的急招
相关推荐

点赞 评论 收藏
分享