百度提前批 AIGC 凉

凉透了啊,主要是基础的机器学习知识不会。。。
1.自我介绍
2.实习介绍
3.实习经历提问
如果有一个无限长文本的大模型,和一个有限长带知识库 rag 的大模型,你怎么利用他们解决长记忆?
调 prompt 过程有哪些问题?
prompt 样本多了效果变差你理解是什么原因?
简单介绍一下 peft 微调和他们的优缺点。
peft 训练的时候有没有注意他们训练的时间长短比较?
你觉得你这个对齐用 RLHF 会不会更好一点?
其他的忘记了
尴尬的开始了,面试官硬要问我机器学习 hh(这个毕竟不是一直做算法,很多基础课都很差)
先问 cos 距离和欧式距离是否是同步增和减?(会不会出现一个增另一个减的问题。我没推出来)
面试官:你这下去看看,这是 rag 向量检索的基础。

写了个代码题字典数
面试官:还是要问点机器学习的。。。
交叉熵公式写一下(慌了,好几个月都没复习这个了🥲,真记不起来,反正各种提示也不记得,寄)
面试官:这种基础的都能忘记啊?
那你再讲讲 self attention 的计算的流程啥的,中间的维度,softmax 对行还是对列?(这块应该没啥问题)
面试官:再问点什么机器学习的呢?交叉熵都不记得了,看看你简历有啥。(思考了一会)算了,就到这里吧,你看看你有啥要问的。

这个时候面试已经一个半小时了😭😭代码题后及时结束多好。。还是要回去复习基础知识了。心碎啊
全部评论
意难平啊家人们,这个 cos 和欧式距离一个是角度一个长度怎么可能同步。。。当时没太明白。 loss 确实是高频考点。 机器学习那些比较基础的八股还是一定要会,虽然一般可能用不到。
3 回复 分享
发布于 2024-08-23 22:03 北京
哈哈,看你是北大的想挽留一下,换成其他学校问到后面早就不耐烦了
2 回复 分享
发布于 2024-08-24 16:21 天津
请问佬,prompt 样本多了效果变差你理解是什么原因?这个问题应该会有哪些原因呢
点赞 回复 分享
发布于 2024-08-24 09:15 北京
研究岗还是业务岗啊,问这么多吗
点赞 回复 分享
发布于 2024-08-26 14:57 北京
佬几面,我也是AIGC,二面秒挂
点赞 回复 分享
发布于 2024-08-26 22:00 浙江
请问现在有后续吗?我也才面这个,太难了二面
点赞 回复 分享
发布于 2024-08-27 22:00 上海

相关推荐

03-11 08:56
已编辑
南京邮电大学 Python
时间跨度:3.2 号投递简历3.3 收到面试邀约 约3.4 拒了换时间3.6 一面一面(45min)面试官介绍团队具体业务---------------------------------------------正式开始面试1. 自我介绍2. 3个项目,先介绍下第一个3. ROS的通信方式知道有哪些?类似于共享内存这种?(话题通信、服务器通信...DDS)4. DDS你用的是哪种DDS?(我说的是ROS组网,面试官想了解的是Fast DDS这种)5. RAG方面你是怎么构建的?有一个流程吗,基本原理说一下(怎么来的,介绍RAG具体流程,最后效果)6. 在实际应用的时候,通过RAG效果不好的话会怎么做?如何优化?(数据集处理,检索排序,query改写)7. 第一个项目获奖了,那你觉得值得改进的地方是哪里?(硬件设备的问题导致于模型推理速度太慢)8. 停顿中……---------------------------------------------9. 第二个项目介绍一下10. 能具体介绍下文本切分方式的一些基本原理吗?11. 你得这个准确率指标是怎么来的?(几个准确率、召回率等)12. 那是主观评价还是用一些量化指标去做?(主观评价)---------------------------------------------13. 第三个项目没细问14. 大模型本地训练是在哪里?训练框架用什么的?15. 大模型相关的框架有了解过吗?(答langchain,RAG用的)---------------------------------------------手撕代码205. 同构字符串 - 力扣(LeetCode)---------------------------------------------面试官细心说明:不要切出页面,不要使用AI助手,可以拿纸张进行计算面试官真的好好10分钟不到发二面邀请了
查看27道真题和解析
点赞 评论 收藏
分享
评论
17
59
分享

创作者周榜

更多
牛客网
牛客企业服务