【算法面经】双非渣硕的 实习+秋招 流水账【已开奖】
背景
广东某双非本+硕,年前有一段微信实习,有三篇在投paper(约等于没有);
暑假去了腾讯PCG实习,但是转正失败了😥
十月份被迫秋招,目前拿了TME的算法岗offer,打算躺平了🤣
春招实习
实习结束刚好过年,寒假结束发现同学都在找实习,才后知后觉的开始刷力扣。
大概一天20-30题的样子,刷了两三周才敢去投简历。
总结
网易:简历挂
网易游戏:简历挂
美团:5月份才通知面试,太迟拒了
b站:同美团,太迟拒了
字节:2面挂
阿里:1面挂
京东:2面时间和腾讯冲突,说五一假期后再约,然后没消息了
腾讯:PCG 实习offer
04.20 字节-data 1面 50min
自我介绍+项目介绍 15min Coding1:5min
力扣原题,秒了!
有哪些优化器?(Adam,Adagrad,SGD)
Adam的二阶矩怎么近似的?(不会)
防止过拟合的技术?(dropout,BN,LN)
Wide&Deep模型细节
防止过拟合的技术?(dropout,BN,LN)
Wide&Deep模型细节
Coding2:10min
面试官聊了一会又想做题了。。。。。链表操作大全
2. 链表原地翻转 https://leetcode-cn.com/problems/UHnkqh/
全是力扣原题,秒了!
详细介绍NDCG
二分类指标?(AP,mAP,P/R)
召回用什么指标?粗排精排用什么指标?
AUC从分布的角度解释?
贝叶斯公式是什么?解释下每一项的含义?
会不会C++?(本科学过)
大数据组件知道哪些?(Spark,Hadoop,但没用过)
总结:春招第一次面试,项目有点生疏,但其他问题答得还行。
二分类指标?(AP,mAP,P/R)
召回用什么指标?粗排精排用什么指标?
AUC从分布的角度解释?
贝叶斯公式是什么?解释下每一项的含义?
会不会C++?(本科学过)
大数据组件知道哪些?(Spark,Hadoop,但没用过)
总结:春招第一次面试,项目有点生疏,但其他问题答得还行。
第二天就接到hr来约2面
04.22 字节-data 2面 50min
自我介绍(被打断)
上来就是coding,最大子矩阵
LeetCode hard原题 https://leetcode-cn.com/problems/max-submatrix-lcci/
磨了20多分钟没思路
面试官让我先写一维的最大子数组,我写出来了但还是没思路,这里就知道要挂了。。。
两条概率题
1. 求期望值 E(min(x1, x2, x3)), x1,x2,x3~U(0, 1)
2. (0, 1)内任意长度的三条边a,b,c组成三角形的概率
1. 求期望值 E(min(x1, x2, x3)), x1,x2,x3~U(0, 1)
2. (0, 1)内任意长度的三条边a,b,c组成三角形的概率
总结:字节今年只招做题家是吧?!
04.26 京东风控1面 40min
图网络项目介绍 20min
GCN/GAT/GraphSAGE介绍,具体到公式细节
Python深浅拷贝和GC机制
Coding: 全排列 + 机器人走迷宫 https://leetcode-cn.com/problems/robot-in-a-grid-lcci/
反问:风控日常工作内容?
GCN/GAT/GraphSAGE介绍,具体到公式细节
Python深浅拷贝和GC机制
Coding: 全排列 + 机器人走迷宫 https://leetcode-cn.com/problems/robot-in-a-grid-lcci/
反问:风控日常工作内容?
面试官是个很客气的小姐姐,问题都答上来了,coding轻松ac
2面约的30号晚上,和腾讯面试冲突想改时间,然后就没有然后了。。
04.28 北京阿里广告1面 70min
coding:快排,旋转数组最小值快排平均时间/空间复杂度?
为什么快排平均复杂度是 NlogN?证明?
聊项目,项目背景?
Domain Adaptation的实验用了哪些指标(只有F1值)
AUC是多少?AUC的定义?
类别不平衡问题是怎么解决的?
你做了哪些事情来模型调优,有什么效果?(调参方面,好像不是他想要的)
有看过具体的分类错误的样本吗?
序列推荐和社交推荐结合有什么问题?你们要解决什么问题?
Domain Adaptation的实验用了哪些指标(只有F1值)
AUC是多少?AUC的定义?
类别不平衡问题是怎么解决的?
你做了哪些事情来模型调优,有什么效果?(调参方面,好像不是他想要的)
有看过具体的分类错误的样本吗?
序列推荐和社交推荐结合有什么问题?你们要解决什么问题?
反问
广告和其他推荐领域有什么区别?(和搜索接近,更复杂,考虑商业目标)
体 验 极 差 ! !
面完秒挂,被刷kpi了,面试官全程挎着张批脸,不想面别面,浪费大家时间!
04.24 腾讯PCG手游推荐1面 60min
自我介绍(被打断)
coding:手写小顶堆+堆排序 20min
coding:手写小顶堆+堆排序 20min
解释代码+时间/空间复杂度
介绍论文 10min (面试官对Graph不是很感兴趣,没怎么问)
用了视频号和公众号的数据集?
看看效果,上线了吗?(只做了离线评估)
评价指标是什么?(介绍Baseline,Recall NDCG)
如何做特征交叉,又哪些模型?(transformer建模序列,Wide&Deep,DeepFM。。。乱答一气)
视频号与公众号推荐场景的区别?
normalization方法有哪些?(Batch/Layer/Instance/Group)
用了视频号和公众号的数据集?
看看效果,上线了吗?(只做了离线评估)
评价指标是什么?(介绍Baseline,Recall NDCG)
如何做特征交叉,又哪些模型?(transformer建模序列,Wide&Deep,DeepFM。。。乱答一气)
视频号与公众号推荐场景的区别?
normalization方法有哪些?(Batch/Layer/Instance/Group)
然后连续问了一堆模型,知道的话就简单介绍下
MMOE(没听过)
PNN(知道名字)
DCN(知道名字)
ONN(没听过)
FTRL(推导了公式,为什么能产生稀疏性,是L1的作用吗?)
MMOE(没听过)
PNN(知道名字)
DCN(知道名字)
ONN(没听过)
FTRL(推导了公式,为什么能产生稀疏性,是L1的作用吗?)
AUC(含义,计算方式,复杂度)
反问:
实习生日常工作?
数据分析->特征挖掘->训练模型->上线模型
大数据框架要求?如何学习?
分布式训练主要用Spark(很简单,单机版看看别人代码就会了);
训练模型用无量(自研版tensorflow)
分布式训练主要用Spark(很简单,单机版看看别人代码就会了);
训练模型用无量(自研版tensorflow)
面试最看重什么?(理论扎实,代码过关)
总结:做完coding之后面试官明显热情了许多,除了几个推荐模型没了解,其他都答得还行,当晚就接到hr约二面的电话
二面 超哥 calvinjiang 一小时 04.30 大概率凉 (居然过了 05.08)
CPU如何执行函数?
处理特征,逐行处理快?还是按列处理快?
统计
如果有一堆数据和标签,(x, y)要如何建模?
介绍下二项分布和多项式分布?
04.30 腾讯PCG手游推荐2面 60min
是压力面!!
面试官看我是计科专业的,基本上把所有基础课有关的知识点都问了一遍,直接拓展,背的八股文都没用上
编程
设计模式了解过哪些?(答了单例模式和工厂模式之类的)CPU如何执行函数?
处理特征,逐行处理快?还是按列处理快?
统计
如果有一堆数据和标签,(x, y)要如何建模?
介绍下二项分布和多项式分布?
怎么做参数估计?
最优化
有哪些最优化方法(不是DL的优化器)?(GD,SGD,牛顿法)
最优化
有哪些最优化方法(不是DL的优化器)?(GD,SGD,牛顿法)
牛顿法的二阶导数的逆难以求解,有什么近似方***BFS,原理不懂)
为什么导数等于0就是极小值?
如果目标函数要收敛,对学习率有什么要求?(不懂)
网络编程
TCP 三次握手
线程池如何实现?
如果目标函数要收敛,对学习率有什么要求?(不懂)
网络编程
TCP 三次握手
线程池如何实现?
线程池怎么做分区?
考虑并发?分段锁?
项目
做了什么来调优?(模型层面(加参数,调参)+特征层面+数据层面)
数据清洗怎么做?
项目
做了什么来调优?(模型层面(加参数,调参)+特征层面+数据层面)
数据清洗怎么做?
如何预测用户的误点击?
反问
部门日常工作?多场景游戏推荐
总结:问题又广又深,算法岗一般不问这些,我都没准备过。。。
反问
部门日常工作?多场景游戏推荐
总结:问题又广又深,算法岗一般不问这些,我都没准备过。。。
全程一问三不知,只能尽量往自己熟悉的方向扯,面完试自觉没戏,
没想到五一后收到了3面的通知???!!
04.30 腾讯PCG手游推荐3面 15min
自我介绍+项目 社交网络上构建无向图,合理吗?(GCN只能处理无向图,大多数工作都是这样处理的)
用了哪些baseline?
闲聊:学校允许实习吗?实习时间?
反问
这是技术面吗?(终面,等hr电话)
实习生日常工作?(没有固定,模型优化)
推荐系统都是用DL了,为什么面试要考传统的ML?(考察基本功)
用了哪些baseline?
闲聊:学校允许实习吗?实习时间?
反问
这是技术面吗?(终面,等hr电话)
实习生日常工作?(没有固定,模型优化)
推荐系统都是用DL了,为什么面试要考传统的ML?(考察基本功)
秋招
6月-9月在鹅厂实习,组内氛围不错,不加班,再加上leader和mentor人也很nice!!!所以all-in了实习转正。
但是因为部门业务调整,实习生的hc基本上没了,答辩也就是走个过场😅。。。
答辩结束和mentor沟通了一下,他说可以走校招流程捞我回来,结果流程到总监那卡了3周。
时间到了9月底,mentor决定放我去面腾讯其他部门了,再次感谢mentor的内推!!
9月28日收到qq音乐的面试邀请!!
10.11 QQ音乐1面 75min
自我介绍+聊项目,直接拿实习答辩的ppt讲(40min)
对评论的文本特征做了哪些预处理?(非法字符+去重+人工审核等级+...)
改进MMOE为什么只CGC模型?PLE的其他改进也有收益吗?(多个loss融合调参困难)
DCN及其变种,公式?每个变种的效率如何?
为什么离线指标只用了AUC?AUC有什么问题?(AUC只反映模型整体上的排序能力)
改进MMOE为什么只CGC模型?PLE的其他改进也有收益吗?(多个loss融合调参困难)
DCN及其变种,公式?每个变种的效率如何?
为什么离线指标只用了AUC?AUC有什么问题?(AUC只反映模型整体上的排序能力)
用gAUC更合理,为什么?(auc被会被活跃用户主导)
DMR序列建模,介绍下模型?有试过拉长至1-2年的行为序列吗?
YouTubeDNN相关,context特征用了哪些?
音乐推荐的场景题 (10min)
DMR序列建模,介绍下模型?有试过拉长至1-2年的行为序列吗?
YouTubeDNN相关,context特征用了哪些?
音乐推荐的场景题 (10min)
新歌怎么推?(可以用side info(封面,歌手,专辑)+ 运营rengon)
我:side info(封面,歌手,专辑)+ 运营
面:歌词也可以用,你觉得能用吗?
我:有点难,我听歌不关注歌词
coding(15min)
1. 最长回文子串
我:side info(封面,歌手,专辑)+ 运营
面:歌词也可以用,你觉得能用吗?
我:有点难,我听歌不关注歌词
coding(15min)
1. 最长回文子串
时空复杂度?(我写了中心拓展法,O(N^2))
有没有更好的方法?(答了应该没有,后来发现有O(N)的Manacher算法。。。面试官笑了笑没有往下问,写这个真是为难人了)
2. 子数组最大和(放水题,贪心秒了)
反问(10min)
有hc吗?(充足,有hc才找你面试的)
内容推荐和其他的推广搜任务相比,有什么特点?(说了一堆...忘了)
TME与其他BG的关系(tme和腾讯是独立的两家公司,但待遇基本上对齐)
TME与其他BG的关系(tme和腾讯是独立的两家公司,但待遇基本上对齐)
10.21 QQ音乐2+3面 30+20min
2面结束,面试官马上让同事来开始3面了
过程和1面类似,主要是深挖项目细节,不再赘述.
全程没有coding,可能是因为我之前的笔试4/5 ?
10.21 hr面+云证
纯聊天,基本上没有刁难我...
自我介绍
遇到过哪些困难?你是怎么解决的?
你如何评价自己?
你的朋友怎么评价你?
家庭情况?有无亲属在tme工作?
10.26 开奖了!!
收到hr谈薪电话 + 录用函!!!!!
总结
1. 多刷leetcode,特别是简单和中等,出hard题说明面试官不想放你过,找下家好了 : )
几个常用算法模板(快排堆排, dfs, bfs, 并查集, ...)可以背下来,背题总比没做过要好!
2. 对自己简历上的内容一定要很熟悉,宁愿少写一点!!
介绍项目参考STAR法则
最后祝大家秋招顺利,都能拿到理想的offer!!