小红书 社区算法 面经
岗位是做首页笔记推荐相关的东西,感觉算是比较核心
10.21一面:
- 自我介绍
- 研究经历询问,研究主线是什么
- 你的这些论文主要解决了什么问题
- 收益体现在哪里,baseline包括哪些
- 讲一下大模型实习,我以为会问推荐实习的
- BERT和GPT的区别,都是怎么训练的
- 二者的finetune一般怎么做
- SFT和RLHF一般各自用在什么场景,各有什么优缺点
- 目前long-context中主流的方法有哪些
- transformer和lstm+attention相比,主要的改进点是什么
- 对整个推荐系统链路有哪些了解
- 打分样本空间分布与精排不一致(精排对粗排返回的样本做排序,粗排则要对召回的样本打分),相关的解决方案了解吗
- 介绍下推荐实习相关的工作
- 有考虑利用线上用户的行为做一些finetune么
- 算法题:lc115,不同的子序列
- 反问:部门业务和工作时长等
算法题下来一搜竟然是个hard,做得磕磕绊绊的,面试官说我动态规划这块题刷少了
————————————
11.1二面,是我遇到过的最难的推荐面试比抖音推荐面试要难许多,不过感觉回答还算OK,最后一题在提示下做出来了
- 自我介绍
- 实习期间最有意义的工作是什么
- 有没有接触过GPU中比较底层的一些算子之类的
- 你觉得LLM对做推荐有什么帮助吗
- LLM如何处理用户的历史行为序列
- LLM与推荐结合落地上有什么问题
- LLM想要和推荐结合,有没有什么可落地的方案
- 介绍推荐实习工作
- 如何处理一些度非常大的用户节点
- 模型的规模,网络的规模
- graph分布式训练是如何实现的,如何分布式存储的
- 新模型指标提升了多少
- 用户推荐一般关注什么指标
- 你觉得业务上为什么会关注总关注数这个指标
- 总关注量越高越好吗,直接去优化总关注量指标会有什么问题
- 直接优化总关注量可能出现很多刷关注的用户,如何从模型和数据等角度去解决这个问题
- 抖音和小红书的推荐系统你觉得有什么差别,从算法的角度上谈一谈
- 小红书和抖音的冷启动处理机制你觉得有什么区别
- 小红书是一次性展出多个笔记,而抖音是刷新出单个视频,你觉得算法上有什么区别
- 算法题1:有n个灯泡,一开始都关闭,执行n轮操作,第k轮将序号为k的倍数的灯的状态反转,请问n轮操作后有几盏灯是亮着的
- 算法题2:给定一个数组,每次从中取出一个数k,然后将数组中所有k-1和k+1都去掉,请问如何取才能保证所取的数之和最大,最大为多少