2021 算法暑期实习申请 个人面经汇总
腾讯- PCG 推荐
一面 60min
1.项目提问
a. 实习项目:FM模型:样本构建,loss weight设计,负样本的价值,与DSSM的差别;索引构建方法、模型更新周期
b. 新闻推荐相关提问:不同模型结构对比(CNN/RNN),模型评价指标、模型调优方向
c. 介绍图神经网络推荐研究
2. 代码题目
a. 题目:剑指offer 26.树的子结构 (没写出来)
b. 题目:LC113.二叉树路径总和II
二面 60min
- 项目提问:
- 机器学习提问
a.特征工程中如何判断特征重要度
b.ReLU函数的特点,缺点,如何改进 - 编程题目: 实现string类 (构造、析构、赋值、拷贝构造函数) (写出来30%)
三面 30min
- 项目提问:推荐比赛项目介绍, 向量召回介绍;
- 介绍归并排序, 说明适用场景、 时间复杂度、空间复杂度
- 其他个人情况了解
hr面
聊天, 略过
字节跳动 - 抖音视频业务
一面[挂掉] 45min
- 项目提问: 介绍比赛项目。 追问:xgboost与gbdt的差别
- 项目提问: 介绍推荐比赛情况, 追问:ItemCF 与 User CF的差别 [答的不够完整]
- 实习项目提问: FM与FFM的区别
- 编程: 1.手撕快排 2. 实现字典序
字节跳动- DATA- EDU
0412 一面 50min
- 项目提问:
序列推荐相关
a. 介绍论文方法
b. 介绍论文中的graph embedding方法
c. graphsage和gcn的区别点/特点
d. 模型softmax训练有无优化
e. zhu w除了GNN以外,还有哪些方法可以做graph embedding: DeepWalk Node2vec
f. DeepWalk node2vec 与GNN相比有什么优势
g. 除了推荐分类任务外,还有哪些任务可以用来学习graph embedding? 节点分类 / 图分类 / 链接预测排序模型提问
a. 接触过什么样的排序模型: GBD T FM deepFM
b. FM的特征交叉怎么做的
c. Deep&Cross模型的特点 怎么做交叉的
d. 多任务/多目标学习了解么? MMOE的特点 (没有答上来)
e. 除了GNN还有什么方法做序列建模 CNN RNN Transformer
f. 介绍Transformer结构, self-attention怎么做的, mask是怎么做的其他机器学习相关提问
a. 介绍AUC指标, ROC曲线的横纵轴是什么
b. AUC是否对正负样本比例敏感
c. 对于ctr/cvr中如果正负比例差异特别大,如何处理: 1. 采样 2. 调整loss weight
d. 给一个长度为1的木棍,随机分成3段,问:构成三角形的概率是多少?1/4编程题目:leetcode 3.无重复字符的最长子串 [Medium]
0415 二面 [挂掉] 45min
- 项目提问:
a.简单介绍一下简历上的项目
b.介绍一下用到的推荐模型
c.谈一下你对推荐的理解 - 开放问题: 教育场景下,给出海量的学生的做题情况,可以做何种任务应用设计
- 编程题目:
a. 给出一个有向无环图 DAG, 出发节点和结束节点唯一,计算图中有多少个关键节点,关键节点即移除该节点,图不连通; 没有写出来
b. 给出二叉树的中序和后序遍历,求先序遍历 (自己建树做测试)
华为 - 中央软件研究院 mindspore
一面 60min
- 编程题目: float转字符串, 考虑各种边界问题
- 项目提问: 介绍论文情况, 介绍新闻推荐项目
二面 30min
- 项目介绍: 论文的创新点, 与已有工作的最大区别
- 对常用深度学习框架的了解情况 torch tf paddlepaddle dgl
- 比赛情况提问, 分工情况,模型情况
美团 - 到店 出行
一面 18min
- 实习项目介绍
- 追问:FM改进点思考
- 编程题目: LC560. 和为K的子数组 (前缀和)
二面 20min
- 实习项目介绍, 介绍对推荐系统完整的了解: 召回 -> 初排 -> 精排 -> 后排
- 编程题目: 手撕快排
小结
申请实习过程参加面试并不是很多,一开始就面比较难的部门,还是比较受挫的。
但总体上每次面试都有一定的进步,越往后回答提问和编程应对能力都越来越强
希望后面能规划好秋招, 多拿offer, 多拿offer, 多拿ofer~~~
#实习##面经##腾讯##美团##字节跳动##算法工程师#