阿里云 AI平台研发 一面

面试公司:阿里云
面试岗位:AI平台研发
面试问题:
1. 自我介绍
2. 介绍RAG项目
3. 你的RAG项目面向的用户群体?
4. LLM用的哪个?
5. 为什么选择了DeepSeek V2.5?怎么考量的?
6. 你负责的部分?
7. RAG的整体链路?
8. 对 transformer 的了解?
9. 注意力机制?
10. 除了MRR,说说还有哪些常见评价指标
11. 多路召回怎么做的?
12. 又聊到搜广推了,双塔模型,召回 粗排 精排 重排
13. 介绍java项目
14. 这个项目的面向人群?(直接坦白了,就是个学习项目orz)
15. es怎么用的?为什么用es?讲了讲倒排索引
16. 项目的数据量?
17. es高可用?分片集群?(es的集群了解的不多,和他讲了讲redis的分片集群原理)
18. 为什么用kafka?和另外两家mq有什么优势?
19. 顺序io为什么快(我自己引出的话题)
20. 零拷贝及其原理(自己引出的话题)
21. 为什么屏蔽词过滤考虑用AC自动机?相比于NLP工具,它的优势在哪?
22. springboot引入mybatis要做那些操作?
23. 算法题,零钱兑换,完全背包dp。写完后给面试官说了思路,面试官说没啥问题,下去之后可以优化成一维dp

反问:
base?
一共几轮面试?(3轮技术+一轮hr)

总结:八股较少,主要问项目,不过没有特别深挖细节。由于是ai研发的岗位,所以问的问题偏向于llm+java混合双打。和面试官聊的很融洽,除了8和9直接坦白说了解的不多以外,其它的全答上来了。感觉面试这玩意和面试官对上脑电波很重要,尤其是不打断你的面试官,可以自己延伸出很多擅长的话题去聊
#牛客创作赏金赛# #软件开发笔面经#
全部评论
太强了又懂搜广推又懂Java
3 回复 分享
发布于 03-04 17:17 湖北
太🐮了,蹲后续
1 回复 分享
发布于 03-04 17:04 北京
太牛了
1 回复 分享
发布于 03-04 20:09 广东
AI平台研发更注重LLM知识还是后端知识?
1 回复 分享
发布于 03-05 12:46 浙江
老哥啥bg 这么牛
点赞 回复 分享
发布于 03-05 12:17 上海
牛友oc了吗
点赞 回复 分享
发布于 03-05 19:43 北京
约二面了吗
点赞 回复 分享
发布于 03-05 21:07 北京
无敌了
点赞 回复 分享
发布于 03-20 10:44 北京

相关推荐

03-11 08:56
已编辑
南京邮电大学 Python
时间跨度:3.2 号投递简历3.3 收到面试邀约 约3.4 拒了换时间3.6 一面一面(45min)面试官介绍团队具体业务---------------------------------------------正式开始面试1. 自我介绍2. 3个项目,先介绍下第一个3. ROS的通信方式知道有哪些?类似于共享内存这种?(话题通信、服务器通信...DDS)4. DDS你用的是哪种DDS?(我说的是ROS组网,面试官想了解的是Fast DDS这种)5. RAG方面你是怎么构建的?有一个流程吗,基本原理说一下(怎么来的,介绍RAG具体流程,最后效果)6. 在实际应用的时候,通过RAG效果不好的话会怎么做?如何优化?(数据集处理,检索排序,query改写)7. 第一个项目获奖了,那你觉得值得改进的地方是哪里?(硬件设备的问题导致于模型推理速度太慢)8. 停顿中……---------------------------------------------9. 第二个项目介绍一下10. 能具体介绍下文本切分方式的一些基本原理吗?11. 你得这个准确率指标是怎么来的?(几个准确率、召回率等)12. 那是主观评价还是用一些量化指标去做?(主观评价)---------------------------------------------13. 第三个项目没细问14. 大模型本地训练是在哪里?训练框架用什么的?15. 大模型相关的框架有了解过吗?(答langchain,RAG用的)---------------------------------------------手撕代码205. 同构字符串 - 力扣(LeetCode)---------------------------------------------面试官细心说明:不要切出页面,不要使用AI助手,可以拿纸张进行计算面试官真的好好10分钟不到发二面邀请了
查看27道真题和解析
点赞 评论 收藏
分享
03-07 16:33
已编辑
字节跳动_llm开发(实习员工)
更新:后面看了一下二面的题目,是原地哈希方法。不过想起来当时忘记问数据范围了,如果里面的值都是在数组大小的范围内,才能原地哈希来做,所以也提醒大家题目先问下数据范围~可能会有一些启发.. #腾讯求职进展汇总# 3.06一面1、需求分析的输出应该有什么?(提到背景、价值、竞品分析、可行性分析,在快手看过比较多的产品文档,提到了还记得的几个点)2、非功能性需求有哪些?(提到安全性、稳定性)3、问实习相关内容(问了比较长时间,很多细节,包括分库分表、数据一致性等)4、缓存三兄弟(缓存穿透、缓存击穿、缓存雪崩)5、工厂模式和策略模式有什么区别?6、实习过程中有没有用过cursor?(说的是copliot 和 kwaicopliot)最难搞的来了,边写代码的时候边问问题(忘记问啥了)1、介绍策略模式并手写策略模式代码2、最长无重复子串(A了之后,问你怎么考虑设计测试用例,我说的是从分支覆盖的角度入手)3、SQL题(涉及子查询和多表联查,大概3个SQL)反问:1、业务:微信小店;2、是否有暑期hc,不清楚。总结:基本上全部都回答上来了,表现最好的一次。3.07二面上来40min两道题1、LC:数组中的重复元素;2、思维题:赛马问题(可看鱼皮的牛客帖)3、询问实习相关内容。总结:面试官问我后续问题的时候我已经懒得答了,因为前面两道题都没做出来知道已经不影响结果了。第一次面试面到情绪崩溃,从19年开始接触Java,自己八股整理了好几万字的东西了,算法刷了400+、500+,思维题最近在看,但是还是能问到没有做过的题目以及没有看过的思维题,可惜了。感觉自己已经变成了一个面试机器,只会做做过的题,只会回答背过的八股,已经没有什么能够自主思考的能力了,因为只有这样感觉性价比才是最高的,只要能面到复习过的,就能过面试,开始迷茫了...想回到大一那种对什么都很新奇,研究新东西的时光了,那应该是段比较快乐的日子。
程序员猪皮:最后一句,确实如此
查看13道真题和解析 腾讯求职进展汇总
点赞 评论 收藏
分享
评论
11
33
分享

创作者周榜

更多
牛客网
牛客企业服务