转转 搜索算法 1面 2面 HR面面经(已意向)
转转2022校园招聘部分岗位已经关闭,还未上车的同学抓紧上车啦!!!
【投递链接】https://campus.zhuanzhuan.com
【急招岗位】算法、前端、测试
【工作地点】北京、深圳、南通
【联系我们】校招答疑QQ群:684236002
【专属内推码】IVKM81
# 8.28转转面经(搜索)
## 1面 8.28
8.28 14:00-15:00
1. 自我介绍
2. 选取两个项目介绍:这里选取了推荐算法以及短文本语义匹配。
**2.1 推荐算法**
(1)特征工程:第一部分用SVD生成用户侧和item侧,用户与item的行为,矩阵构成基于共现的,项目成员,负责部分。初始化Embedding层。除了user_id,item还有其它特征吗。构造图是异构图吗?**权重如何考虑**?------(权重是否可以考虑距离当前天时间紧的权重大),deepwalk和svd效果对比,传统机器学习与深度学习的对比。svd初始化Embedding层时是变化的,deepwalk的表征向量是作为特征输入。一条样本的构成
(2)按照日期划分,按照天来,划分太粗糙了,受限于数据集,没有具体时间。deepwalk的区别,感觉就一个十几天一个一天的?
(3)给定向量的含义。
(4)MMoE专家个数?专家个数对结果的影响。
(5) 进一步的思考,特征所有拼凑到一块,现在是否有改进的思路。思考整个设计的改进思路,完成第一版上线,接下来迭代如何?业务和模型的思考,赋能业务。
**2.2 短文本语义匹配**
(1)微调阶段用的那一版bert?finetune是有两个目标,MLM和NSP,尝试的时候原封不动进行的吗?为什么没有用MLM?试了没有用NSP的效果吗?准确率最后多少?准确率好像不高?
(2)脱敏的影响?
(3)N-Gram有没有尝试其它种的N-Gram,比如TextCNN滤波器个数
(4)cls和最后一层获得的是词向量,最后一层如何处理的,得到的是词向量,如何获得句子向量。
(5)负样本如何构建的?这里忘记了,回答没有
(6)效果怎么样,第一多少?能否复现第一的方案,即工程能力。
3. 一个骰子,投N次,最大概率的和是多少。
4. 一个数组,求第二大的数
## 2面 8.29
8.29 10:00-10:40
1、自我介绍
2、介绍两个项目
2.1、介绍了一个推荐,之后了解建模过程中的一些思路。
(1)Word2vec构建用户和item的隐性表达,为什么想到这么做?为什么word2vec为什么能够帮助做些这些事,主要了解word2vec的原理。训练过程中如何使整个Embedding能够在序列中近似的语义空间内,loss如何降低,word2vec的训练过程。loss如何定义。二分类过程中经常使用的损失函数,为什么选择交叉熵作为二分类的损失函数?(从另外一个角度问,优化模型时最后求解什么?参数。求解参数的过程叫作参数估计?有哪些方法:极大似然和最大后验)
(2)为什么使用异构图学习用户和视频的表达,具体介绍一下。deepwalk的实现。deepwalk之前是否有一些历史优秀算法的承接发展,思想如何演变过来的(为什么有deepwalk的想法出现)。为什选择deepwalk作为自己的方案(参考其它方案,为什么没有选择其它方案,思考的过程)
2.2 介绍短文本语义相似度
(1)如何定义这个问题的,包括技术的思路,如何想的。
(2)使用bert比word2vec效果好,为什么bert比word2vec效果好。主要回答结构时多头注意力以及mask策略
(3)具体讲什么叫attention机制,attention最开始是NLP提出吗,从图像角度解释为什么attention。
3、研究生阶段主要的研究方向,简单介绍一下,问了一些为什么要这么做。
4、为什么对数据竞赛比赛感兴趣
5、反问环节:为了技术栈,以及传统、深度模型的场景
3面 9.2(HR)
9.2 20:00-20:20
1、对一轮二轮面试的整体感受
2、其它大厂公司面试流程(安排了嘛,面了嘛)
3、职业规划(数据类,算法类,研发类)以及意向城市
4、意向深刻的项目介绍一下(介绍了一部分,不然太多了)
5、老师、同学以及朋友对自己的评价,是否认可
6、对自己的认识,缺点,待提升的地方
7、大学,研究生除了学习之外的生活(如果度过)
8、介绍了转转以及给了一些建议
9、反问环节:问了企业文化以及时间
10、是否能实习
还愿来了
总于拿到了
开心
9.5号下午4点17收到意向书
#面经##转转#