美团北斗—推荐算法 一面

 一面面经【90min】
hr介绍他们的业务,针对他们的业务我也问了相关问题

正片开始:
自我介绍。然后讲一篇自己的论文。这里会问论文细节。这里完成后大概35min。

Part 1:序列建模
Q1:我看你的工作也涉及到了序列建模,那你对序列建模了解多少?
A1:知道DIN是怎么做的,看过DIEN的摘要。
Q2:好那问你两个关于DIN的问题。DIN要和每个历史物品算相似度,假设历史物品有2000个,复杂度太大了,怎么优化?
A2:召回里的最近临查找,实际就是聚类。
Q3:DIN选出的历史相似的item,是没有考虑item出现的位置的。比如有些item出现的位置离当前特别远,怎么考虑历史item的远近信息?
A3:直接加item的位置特征。

Part 2:样本不平衡
Q4:他们有好多个场景,有数据量很大的场景,也有数据量很小的场景。如何用大场景的丰富数据,把小场景也训练好?
A4:考虑迁移学习那套,私有+共享两部分
Q5:那翘翘板现象怎么解决?
A5:按照腾讯PLE论文讲了讲。
Q6:还有其他方法吗?预训练怎么做?
A6:讲了预训练和finetune的方式。
Q7:那如何对小样本模型做在线更新?
A7:讲了更新方式,感觉面试官应该觉得没问题。

Part 3:样本不一致
Q8:比如ctr预估的时候,有些样本特征一致,但label不一致,该怎么解决?
A8:看和这些特征完全一致的样本,统一成特征类似的样本的标签。
Q9:比如两组特征一致的样本,一组的正负比例9:1 一组5:5,有什么区别吗?
A9:9:1那组更可能有些错误样本,5:5那种不一定是错误样本,可以在预测label时,把label改为小数。比如训练用交叉熵,loss=ylogp,把y改成0.5而非1。
Q10:好既然说到了交叉熵,那么我们这个场景能否不用ce,而换成用mse?
A10:不能。具体原因我刚好看到过,答对了。

最后是coding 题目是最长递增子序列

还在招聘
【岗位类型】北斗计划(面向全球高精尖校园科技人才):  大模型与AIGC、自动驾驶、无人机、视频编解码、运筹优化和智能调度等
秋招岗位-算法/技术/产品/商业分析/运营/金融/供应链/职能/市场营销/设计/销售、客服和支持等10大类

可内推【投递链接】:https://zhaopin.meituan.com/web/campus
😀【内推码】WA3N2P4
#美团##美团北斗计划##内推##算法##25届提前批#
全部评论

相关推荐

联想
|
校招
|
超多精选岗位
点赞 评论 收藏
分享
点赞 7 评论
分享
牛客网
牛客企业服务