【百度】北京 - 机器学习/数据挖掘/自然语言处理

百度

百度秋招很早就开了,提前批和正式批一起竞争HC应该。 秋招的时候一天面完三面(如果顺利通过)。如果没有收到下一面,这可能是还有更优秀的同学,面试官会优先面试他们。

度子秋招补录捞了一次,还是二面挂😓;春招做文心一言的还想捞我,估计是简历评估没过,没捞成。

投递2023-09-06

  • 北京 - 机器学习/数据挖掘/自然语言处理(J59614)

笔试2023-09-12

忘了,只记得选择题很难。

一面2023-09-23

  1. 自我介绍。
  2. 讲一下Transformer的主要结构。(Self-Attention+FFN)Encoder和Decoder的区别。(主要区别在Attention里,encoder是双向的、decoder是单向的)还了解哪些Attention机制?(讲了一个SE-Net,其他的就不了解了)
  3. 了解哪些多模态学习的方法?(CLIP、ALBEF、VLMo)讲一下CLIP。
  4. 除了CLIP的ITC损失,还有哪些损失?(ITM、MLM)
  5. MLM、ITM损失具体怎么实现?(感觉都是交叉熵)LM和MLM的区别?(LM单向预测,MLM双向预测)
  6. 多模态学习的关键?(编码和对齐)
  7. 了解哪些对齐的方法?(不了解TAT)
  8. 大模型微调与普通微调的区别。(大模型微调指冻住大部分参数,仅选择部分参数,或添加部分参数进行微调)了解哪些大模型微调方法。(P-tuning、LoRA)
  9. 挑一个项目讲。(解决问题+创新之处+结果)

手撕: 二叉树的所有路径和之和。 二叉树:每个节点取值为0~9。 路径:根节点到叶子节点。 路径和:路径上每个节点的数拼接。如路径为“1->3->2”,路径和为132。 求这颗二叉树所有路径和之和。

之后,感觉没什么要聊的了

  1. 你们专业主要学习了什么课程?(模式识别、机器学习、高级企业级开发技术)
  2. 投的什么岗位?(机器学习、数据挖掘、自然语言处理)讲一下自然语言处理中的词嵌入。(词袋模型、TF-IDF、Word2Vec、ELMO、BERT)
  3. 回溯和递归的区别?和动态规划的区别?
  4. 反问:有什么需要提高的地方?(简历写了很多,但要深入了解某个方法)

二面2023-09-23

说好半小时后的,结果面试官没来。吃午饭,下午突然电话过来说,邀请我面试。

拷打。被共享了捏。

  1. 自我介绍。
  2. 介绍两个项目。深挖。
  3. BERT和GPT的区别。(BERT使用的为Transformer Encoder、GPT使用的是Transformer Decoder。)
  4. 介绍大模型微调。有没有使用过DeepSpeed。(没有)LoRA介绍(讲得不好)。
  5. BatchNorm和LayerNorm的区别?什么时候用BatchNorm、什么时候用LayerNorm?
  6. Python中参数传递,什么时候是引用,什么时候的数值。(可变对象和不可变对象)
  7. 对比学习介绍。(举了个SimCRL的例子)对比学习损失函数有哪些。(不了解,后面搜了一下,InfoNCE、RINCE、ReLIC)

手撕: LeetCode 93. 复原IP地址

没有考虑到两个0的情况。 如00000输出应该不包括,00.0.0.0。

(补录)一面2024-01-19

面试官改了两次时间。。听说是感冒了+临时会议。(可以看出来挺忙(也可能是到年底了)) 视频会议【如流】。大概60分钟。

  1. 自我介绍。
  2. 做题。

面试官在聊天框发题目,复制到本地IDE写代码。之后复制粘贴到【如流】上,有一个【代码考核】的编译器环境。

(1)leetcode 15. 三数之和

30分钟解决,之后提交到leetcode上也ac了,不过就是用时比较长。之前做了好几次没做出来。

(2)leetcode 695. 岛屿的最大面积

10分钟解决,之后提交到leetcode上也ac了。还算比较简单。

  1. 介绍一个项目。
  2. Transformer的结构。
  3. Transformer为什么好于GNN。
  4. 多头自注意力的实现。

(补录)二面2024-01-23

视频会议【如流】。大概60分钟。

开局两困难道题(手动流汗黄豆😓),明显故意刁难。

  1. 自我介绍。(一直共享屏幕,没怎么看到面试官的帅脸。)
  2. 做题。

面试官口述题目,打开本地IDE,做完后给面试官截图。做了两题,每题15分钟。一题都没做完。 (1)整数拆分。leetcode上没找到原题。

数学上的整数拆分问题

将一个整数拆分成若干整数之和,返回所有不同的方案

如,3=2+1,3=1+2,3=1+1+1,3=3 其中,3=2+1与3=1+2是同一种拆分方式。

太难了没做出来。

(2)leetcode 221. 最大正方形

写了个的方法。代码还差一点写完。

  1. 介绍项目。
  2. attention的原理?(不是很理解,后面觉得应该回答“为什么要有Attention”)
  3. Transformer和TextCNN的区别?

没有反问。感觉面试官很忙。

#我的失利项目复盘##百度##复盘面经#
2024秋招 文章被收录于专栏

谨纪念我从2023-08-22以来长约半年的校招历程

全部评论
难 明天同岗位面试
点赞 回复 分享
发布于 2023-09-23 22:17 福建
佬,想问下 百度的笔试安排一共有多少场呢?明天的笔试时间有冲突,想推到下一次,但是怕明天是最后一场了555
点赞 回复 分享
发布于 2023-09-25 22:31 江苏
佬,这个是百度哪个部门,我被商业研发部同岗位捞起来面的问题很水😰
点赞 回复 分享
发布于 01-09 23:35 陕西

相关推荐

10-26 10:24
已编辑
New York University 销售工程师
投递华为软件技术有限公司等公司10个岗位 名企内推
点赞 评论 收藏
分享
6 54 评论
分享
牛客网
牛客企业服务