搜索广告- 算法实习一面
0.实习+项目
1.tokenizer
2.PreNorm和PostNorm区别?
3.为什么PostNorm效果一般更好?
4.BN的可学习参数?作用?
5.xDeepFM介绍
6.DCN的架构
7.WideFM和DeepFM区别?这一系列模型出现是为了解决什么问题?
8.长序列建模的方法
9.DIN架构实现细节
10.SIM改进了什么问题
11.召回粗排精排的链路
12.重排实现的策略
13.多任务学习MoE的认识
14.介绍相关模型(MMoE,PLE)
15.极化现象
16.ESMM
17.SSB样本选择偏差
lc mid
题目中规中矩,对于我这种新手体感还不错
1.tokenizer
2.PreNorm和PostNorm区别?
3.为什么PostNorm效果一般更好?
4.BN的可学习参数?作用?
5.xDeepFM介绍
6.DCN的架构
7.WideFM和DeepFM区别?这一系列模型出现是为了解决什么问题?
8.长序列建模的方法
9.DIN架构实现细节
10.SIM改进了什么问题
11.召回粗排精排的链路
12.重排实现的策略
13.多任务学习MoE的认识
14.介绍相关模型(MMoE,PLE)
15.极化现象
16.ESMM
17.SSB样本选择偏差
lc mid
题目中规中矩,对于我这种新手体感还不错
全部评论
我以为prenorm一般效果更好😄
相关推荐
点赞 评论 收藏
分享
09-30 23:14
哈尔滨工业大学 算法工程师 勇敢的联想人前程似锦:估计是一开始一共有3个人,第一位次发offer,第二位次当备胎,你第三位次挂掉。但是呢,第一位次的大佬拒了offer(这是大概率事件,因为大佬手上不缺大厂offer,所以很大概率拒快手)。然后呢就把第二位次发offer了,又怕第二位次拒offer,所以把你重新捞起来当备胎了。
点赞 评论 收藏
分享
投票
点赞 评论 收藏
分享
点赞 评论 收藏
分享