喜马拉雅搜广推算法春招二面面经

GBDT为什么叫做梯度提升决策树,梯度用在什么地方
gpt的input的encoding是怎么做的
Inmediate model的输出是什么?四个任务分别是什么?四个指标分别是什么?怎么构建的负样本?为什么是基于摘要场景训练的,但是用在对话场景呢?
svm的核函数,升维到高维空间,理论上一定可分吗
fm了不了解
unieval项目的后续应用
gpt的decoder是怎么构成的
dropout在预测时候是怎么预测的
为什么使用layernorm而不使用bn
全部评论
请问一面和二面隔了多久啊
点赞 回复 分享
发布于 03-05 12:20 香港
怎么问好多大模型的,是你的研究方向吗
点赞 回复 分享
发布于 2024-06-26 18:24 湖南

相关推荐

今天老师给大家梳理了部分大厂搜广推算法岗面试真题,供各位同学参考学习。1.PPNet的核心思想是什么?为什么要 stop gradient ?什么时候不需要这样操作?2.多目标模型很容易遇到跷跷板问题或者两个 loss 数量级相差很大,优化速度差异太大,你知道有什么优化方法吗?3.NEG loss 和 NCE loss 有什么区别? infonce loss 公式是什么4.召回业务一般怎么定义负样本? bce loss 的公式是什么?简述一下 Pointwise , pairwise 和 listwise 的区别是什么?召回一般用什么 loss ?5.粗排的作用?怎么验证粗排精排的链路一致性?用什么指标可以衡量链路一致性?6.大模型了解吗?怎么在推荐中应用?比如怎么在召回中用?大模型训练分成哪几个阶段?简述一下各个阶段在干什么7.千万级别的整型数组,怎么获取其中出现次数最多的前 N 个数?(考数据结构)8.讲一下你知道的机器学习里面的算法,比如 AdaBoost , GBDT , XGBoost 这些。 Bagging 和 Boosting 的区别?随机森林是什么9.讲一下Word2vec是怎么做的?怎么降低计算复杂度?10.你知道的中心极限定理有哪些?11.双塔模型优势和缺点,怎么改进?12.粗排的目的是什么?有哪些指标,粗排应该向精排看齐吗?13.说一下 BN 的公式,哪几个参数是在训练时更新,在推理时还更新吗?简述一下测试过程中的 BN 怎么算。 BN 和 LN 的区别?14.当神经网络的权重初始化为0时,会遇到什么问题?15.你能抽象地归纳出序列建模发展的脉络吗?以及它的最终形态应该是什么样子?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
13
分享

创作者周榜

更多
牛客网
牛客企业服务