bigo推荐算法一/二面 面经
一面:
1.lstm原理三个门作用和sigmoid函数tanh使用,梯度消失问题如何解决,rnn为什么不能,缺点如何造成的。lstm如何解决长期记忆问题
2.bert原理和注意力机制介绍一下
3.dssm为什么不能做user和item的交叉,dssm有什么优缺点,item端如何处理语义的
4.召回和排序中有哪些模型,原理都了解吗?fm,deepfm,wide啥的
5.lr特征为什么要离散化
6.auc公式是什么,如何一句话解释auc的含义,数据不平衡对auc有影响吗,还有什么指标可以针对不平衡数据。
7.常用激活函数都有哪些,优缺点
8.时序模型用哪些,各有什么优势,介绍一下
9.商品匹配多模态如何做的(自己的项目)
10.召回后搜索fassi近邻搜索的原理
代码题:最长不重复子串
二面:
1. 针对不平衡样本问题,在通过上采样后,正例:负例的比值由1:10变为2:10,则dnn模型预测的概率会增大多少,若想要当前输出概率和原始期望想同,则需要如何操作
2. dnn如何评估特征有效性和重要性,其他机器学习模型呢,统计方法呢?
3. 如何进行的自创mixup采样操作(问不平衡采样一般的方法)
4. 双塔模型是做什么的,为什么不用热度推荐,相比的话dssm有什么优点
5. 如果遇上一个新item,它的向量该如何计算或者处理,如何解决新user和新item进来的问题(计算相似度,热们物品向量加权填充),特征缺失该怎么办。
6. 手撕:合并k个有序数组 (我只做了合并两个,结果惨了····)
7. 手撕提高版:给定一个由二元组组成的列表,分别代表分数和类别,给定一个k,要求按分数大小输出同时满足类别不能连续k个相同。
输入:[(1,1),(2,2),(3,3),(4,3)],k = 2
2. dnn如何评估特征有效性和重要性,其他机器学习模型呢,统计方法呢?
3. 如何进行的自创mixup采样操作(问不平衡采样一般的方法)
4. 双塔模型是做什么的,为什么不用热度推荐,相比的话dssm有什么优点
5. 如果遇上一个新item,它的向量该如何计算或者处理,如何解决新user和新item进来的问题(计算相似度,热们物品向量加权填充),特征缺失该怎么办。
6. 手撕:合并k个有序数组 (我只做了合并两个,结果惨了····)
7. 手撕提高版:给定一个由二元组组成的列表,分别代表分数和类别,给定一个k,要求按分数大小输出同时满足类别不能连续k个相同。
输入:[(1,1),(2,2),(3,3),(4,3)],k = 2
输出:[(4,3),(2,2),(3,3),(1,1)]
解释:原始数组排序后必须满足类别不能连续k个一样的条件,因此[(4,3),(3,3),(2,2),(1,1)] -> (4,3),(2,2),(3,3),(1,1)]
个人感受:面试官很好的,但是奈何我太菜,好多东西没准备好,感觉问的问题都很尖锐,是有区分度的那种。
个人感受:面试官很好的,但是奈何我太菜,好多东西没准备好,感觉问的问题都很尖锐,是有区分度的那种。
三面:(主管面)
1. 自我介绍
2. 实习经历和项目(主要时间在谈这个)
3. 具体实现和遇见的问题
4. 为什么转型做算法(我是非科班)
5. bigo公司了解吗,我们针对的是海外直播和交友市场
6. 期望地点在哪里
7. 平时有什么爱好
8. 反问:公司的定位以及我所在的部门情况。
HR面:
刚通知。后续继续更新
#BIGO校招##面经##算法工程师#