快star大模型应用面经
第一次分享,攒人品!
一面
🕒 岗位/面试时间
快star大模型应用/8月9日早上
👥 面试题目
1.自我介绍
2.题目 leetcode300 最长递增子序列 15min 没让讲思路
3.研究进展,投什么会议
4.实习经历
5.实习项目中数据是怎么做的
追问,数据收集过程中是否有人工处理
蒸馏效果不好的原因是什么,用了什么额外的方式
有没有做量化和加速
6.偏好数据集是什么,偏好怎么定义的
偏好是怎么增强的
7.什么是打判,怎么打判的
使用的什么模型
8.如何解决模型幻觉(分方法,数据,prompt,微调,RAG等等)
9.长token输入效果衰减如何解决,效果如何(长度外推问题,建议直接看苏神的blog)
10.moe和dense模型的区别,各自的优缺点(随便答了一下moe效率高,每次激活一部分参数,但是同等参数量效果应该没有dense好)
反问:组里主要做对内的大模型应用,包括code辅助,个人RAG之类的
🤔 面试感受
面试官人很好,提问欲望强烈,实习经历问的很细,会对着简历上的东西一条一条问,本来还要问我的研究但是没时间了,最后问了三个简单的八股
💢 背景
双C9,一段实习,无论文(或者说正在写)
希望能对大家有帮助!
#面经#
等一下结果
-----------
更新,直接寄!果然人才计划不会要我这种没论文的小菜鸡吗
一面
🕒 岗位/面试时间
快star大模型应用/8月9日早上
👥 面试题目
1.自我介绍
2.题目 leetcode300 最长递增子序列 15min 没让讲思路
3.研究进展,投什么会议
4.实习经历
5.实习项目中数据是怎么做的
追问,数据收集过程中是否有人工处理
蒸馏效果不好的原因是什么,用了什么额外的方式
有没有做量化和加速
6.偏好数据集是什么,偏好怎么定义的
偏好是怎么增强的
7.什么是打判,怎么打判的
使用的什么模型
8.如何解决模型幻觉(分方法,数据,prompt,微调,RAG等等)
9.长token输入效果衰减如何解决,效果如何(长度外推问题,建议直接看苏神的blog)
10.moe和dense模型的区别,各自的优缺点(随便答了一下moe效率高,每次激活一部分参数,但是同等参数量效果应该没有dense好)
反问:组里主要做对内的大模型应用,包括code辅助,个人RAG之类的
🤔 面试感受
面试官人很好,提问欲望强烈,实习经历问的很细,会对着简历上的东西一条一条问,本来还要问我的研究但是没时间了,最后问了三个简单的八股
💢 背景
双C9,一段实习,无论文(或者说正在写)
希望能对大家有帮助!
#面经#
等一下结果
-----------
更新,直接寄!果然人才计划不会要我这种没论文的小菜鸡吗
全部评论
快手面试体验还是可以的
佬总结下llm学习路线
我理解这个岗应该是偏dev,rag agent哪些?
确实,我也是这个直接挂
图挺不错的
同一个岗位 本来觉得还行,然后挂了
老哥你帖子太有意思了,梗笑的我想死
太强了
同学,考虑字节商业化LLM算法嘛~
相关推荐
点赞 评论 收藏
分享
//鲨鱼辣椒:什么什么都作废了,如同一场大雪覆盖了前半生的荒唐
点赞 评论 收藏
分享