高德一面

1h30min

八股:
1. lora原理,lora初始化,AB可以全零或者全高斯吗,通常在什么参数矩阵上加lora,有什么超参数,怎么知道哪些超参数组合效果最好
2. dpo/ppo/spin原理,loss,过程中有几个模型
3. dpo正负样本之间只有少量差异,这个时候效果不好,为什么,怎么解决
4. 训练的pipeline,deepspeed zero123原理和用了哪个,为什么用这个
5. 量化框架知道哪些?vllm原理
6. 大规模数据,rag怎么快速检索召回(不知道,面试官说什么稀疏index什么什么的,没听过也没记住)
7. 对比学习原理,怎么做的,哪些做负例哪些做正例,loss,超参数,最终是什么参与loss计算

主要拷打实习:
1. 实习rag中的embedding模型用的哪个,为什么用,为什么不用bge
2. 知识库是单纯召回,还是有精排,策略,链路什么样,都用了哪些模型
3. 模型部署上线经手了吗,参与度
4. dpo数据怎么来的,自己改还是模型生成,效果好吗,有探索过最新的对齐方法吗
5. 最近读过的论文,实习有用比较新的论文的方案吗,照比现在方法改进点在哪
6. 实习公司数据库用的什么

手撕:
编辑距离,听说过没做过,没撕出来
换了道easy,链表有无环,感谢面试官!
全部评论
是深度学习算法吗,感觉是一个面试官😂
点赞 回复 分享
发布于 09-29 20:51 北京
同一个面试官 怀疑他们根本不招人
点赞 回复 分享
发布于 10-09 09:51 北京
同一个面试官,问的问题都一样哈哈,手撕也一样
点赞 回复 分享
发布于 10-11 13:08 四川

相关推荐

09-23 16:37
门头沟学院 Java
点赞 评论 收藏
分享
6月初入职阿里系实习,1085,方向和自己想做的事情略有偏差,但我假装不去考虑这些。水硕生活已经耗尽了我全部的能量,我只想好好度过这个暑假。杭州的生活闲适简单,和美国比起来简直是天堂一般。周三去天目里遛弯,周五去湖滨购物,周末去上海放风。我沉溺于短暂的美好中,逃避秋招的压力,就这么错过了大多数的提前批。8月底离职后开始了秋招的日寄。第一个面试的是美团到家,很意外流程如此快,结果当然因为三个月的生疏直接送掉了一面。找朋友在字节内问了一个较为wlb的部门,顺风顺水地通过了一面。又投了几个中大厂,我想秋招应该可以在九月结束了。结果证明我不懂java后端,至少不懂半转行的java后端。雪上加霜的是时差...
SDE文:留子找工的苦只有留子才能体会,我研一才开始学计算机,天天凌晨4点做笔试,暑期实习找不到最崩溃的那几天身边最好的朋友拿了amazon的offer,在领英上congrat他后我哭了半个晚上,我连国内都找不到,别人已经拿美国的实习。后面有次跟他闲聊我无意间说我4月底特别崩溃,他说是不是是当时他拿到amazon的Offer刺激到我了,我赶紧瞎编说是当时被一个国内面试官压力了(就这种很崩溃但还要装作一直很为朋友高兴的感觉)那段时间感觉自己都没个人样了,每天都一个人偷偷哭
点赞 评论 收藏
分享
2 3 评论
分享
牛客网
牛客企业服务