秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
第一面很厉害了
1 回复 分享
发布于 2024-08-21 23:50 黑龙江
佬投的杭州还是北京呀
1 回复 分享
发布于 2024-08-22 20:26 北京
佬是投正式批吗
点赞 回复 分享
发布于 2024-08-20 17:26 北京
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 2024-08-24 01:03 北京
m
点赞 回复 分享
发布于 2024-09-01 12:15 浙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 2024-09-03 10:47 北京

相关推荐

面试公司:阿里云面试岗位:AI平台研发面试问题:1. 自我介绍2. 介绍RAG项目3. 你的RAG项目面向的用户群体?4. LLM用的哪个?5. 为什么选择了DeepSeek V2.5?怎么考量的?6. 你负责的部分?7. RAG的整体链路?8. 对 transformer 的了解?9. 注意力机制?10. 除了MRR,说说还有哪些常见评价指标11. 多路召回怎么做的?12. 又聊到搜广推了,双塔模型,召回 粗排 精排 重排13. 介绍java项目14. 这个项目的面向人群?(直接坦白了,就是个学习项目orz)15. es怎么用的?为什么用es?讲了讲倒排索引16. 项目的数据量?17. es高可用?分片集群?(es的集群了解的不多,和他讲了讲redis的分片集群原理)18. 为什么用kafka?和另外两家mq有什么优势?19. 顺序io为什么快(我自己引出的话题)20. 零拷贝及其原理(自己引出的话题)21. 为什么屏蔽词过滤考虑用AC自动机?相比于NLP工具,它的优势在哪?22. springboot引入mybatis要做那些操作?23. 算法题,零钱兑换,完全背包dp。写完后给面试官说了思路,面试官说没啥问题,下去之后可以优化成一维dp反问:base?一共几轮面试?(3轮技术+一轮hr)总结:八股较少,主要问项目,不过没有特别深挖细节。由于是ai研发的岗位,所以问的问题偏向于llm+java混合双打。和面试官聊的很融洽,除了8和9直接坦白说了解的不多以外,其它的全答上来了。感觉面试这玩意和面试官对上脑电波很重要,尤其是不打断你的面试官,可以自己延伸出很多擅长的话题去聊#牛客创作赏金赛# #软件开发笔面经#
想睡觉的人zzz:太强了又懂搜广推又懂Java
点赞 评论 收藏
分享
时间跨度:3.2 号投递简历3.3 收到面试邀约 约3.4 拒了换时间3.6 一面一面(45min)面试官介绍团队具体业务---------------------------------------------正式开始面试1. 自我介绍2. 3个项目,先介绍下第一个3. ROS的通信方式知道有哪些?类似于共享内存这种?(话题通信、服务器通信...DDS)4. DDS你用的是哪种DDS?(我说的是ROS组网,面试官想了解的是Fast DDS这种)5. RAG方面你是怎么构建的?有一个流程吗,基本原理说一下(怎么来的,介绍RAG具体流程,最后效果)6. 在实际应用的时候,通过RAG效果不好的话会怎么做?如何优化?(数据集处理,检索排序,query改写)7. 第一个项目获奖了,那你觉得值得改进的地方是哪里?(硬件设备的问题导致于模型推理速度太慢)8. 停顿中……---------------------------------------------9. 第二个项目介绍一下10. 能具体介绍下文本切分方式的一些基本原理吗?11. 你得这个准确率指标是怎么来的?(几个准确率、召回率等)12. 那是主观评价还是用一些量化指标去做?(主观评价)---------------------------------------------13. 第三个项目没细问14. 大模型本地训练是在哪里?训练框架用什么的?15. 大模型相关的框架有了解过吗?(答langchain,RAG用的)---------------------------------------------手撕代码205. 同构字符串 - 力扣(LeetCode)---------------------------------------------面试官细心说明:不要切出页面,不要使用AI助手,可以拿纸张进行计算面试官真的好好10分钟不到发二面邀请了
查看27道真题和解析
点赞 评论 收藏
分享
评论
10
62
分享

创作者周榜

更多
牛客网
牛客企业服务