百度机器学习/数据挖掘/自然语言处理工程师暑假实习面经
应该是百度的实习专场,三轮技术连着面。
一面
算法题:leetcode 70.爬楼梯
- 介绍竞赛项目
- 竞赛数据规模
- ANN中用户的embedding怎么得到的
- w2v的召回具体怎么做的
- ANN的工具用的啥
- 基于深度的召回怎么做的
- 排序阶段的特征有哪些
- 后打压怎么做的
二面
算法题:假设现在有很多海岛,有些海岛之间有桥连接,你已知海岛连接情况。 ① 我现在想从到 A岛 去 B岛,问是否能通过陆路到达(过桥) ②如果可以,最少需要过几次桥 ③输出一条最短的路径 (P.S. 最好可以写一个非递归的形式)
- 介绍竞赛
- 评估标准是啥
- 哪些特征比较有用
- 多路召回的分数为什么要相加
- 有没有分析 bad case
- 优化思路
- 讲一下推荐的方法
- 一个全连接层有多少参数
- 介绍 attention
三面(手百搜索部门)
- 介绍研究方向
- 论文中 embedding 效果的评价方法和指标
- 为什么选择数据挖掘这个方向
- 对于实习的目标
- 反问部门业务和技术栈