腾讯广告一面面经
共计55min
1、讲一下推荐算法的实习?
2、八股
机器学习按标签可以分为哪几种?知道哪些机器学习算法?BN和LN的区别?如果文本按词粒度处理可不可以用BN?MHA中的dropout和MLP的dropout有什么区别?QKV怎么得到的?注意力公式?逻辑回归损失函数为什么用交叉熵不用MSE?
3、讲一下大模型实习?
你是怎么取得效果的?每一项措施取得的效果占比大概是多少?
4、做题
全排列
一个很长的数据流N,N未知,如何在只遍历一次的情况下取出m个数,使每个数被取到的概率都是m/N? 说思路不写代码,但是必须给出公式
八股还问了一些别的但是想不太起来了。