字节抖音搜算法面经(已意向)

薯薯多模态和大模型出身,搜推零基础,意向是字节抖音搜的搜索推荐方向

一面
15分钟实习,15分钟论文,15分钟八股,15分钟算法
八股和实习和论文高度相关。问了ppl的计算与物理含义,Transformer的结构,self Attention为什么要除以根号dk,神经网络能否用全0或全1初始化,还有一些问题记不住了
算法是编辑距离
面完15分钟后就约2面

二面
20分钟实习,穿插点八股,问我大模型的微调技术了解多少,讲了LoRA、ptuningv1、ptuningv2、qLoRA
问我有无搜广推经历,回答无,遂让写算法
给了一道原创(貌似是,没刷过)算法,难度mid,给一个质数数组和一个数k,从数组中选两个数组成真分数,问有多少总组合方式大于k。答了一个O(n2)的算法,面试官让优化,思考了一会想出了一个O(n)的算法,coding并跑通测例
然后面试官加了一问,让找出第k大的真分数,感觉应该是hard难度了,没思路,随便说了个算法
反问,面试官非常不耐烦,以为凉了

三面
莫名其妙就过了二面,三面主管面,面试体验很好,主要讲论文和实习,大概讲了40分钟,可以看出来面试官很认真的在听在问,正反馈很强。
后让写题,找出数组的第k大元素。我知道有两种写法,基于堆是O(nlogn),基于快排是O(n)。写了个堆的解法,等面试官让我优化,结果没让优化。
后面问了些场景题,问我有没有用过抖音,问现在抖音搜和抖音推存在哪些问题,如果让我来会怎么改进。没什么经验瞎说了一些。

hr面
问问有哪些o,为什么不继续做大模型,家里是哪里的,对字节这边有什么了解

希望能给牛友们提供一些参考~希望自己能做出最适合自己的选择
全部评论
大佬方便透露论文情况吗
1 回复 分享
发布于 2024-11-08 17:53 陕西
大佬是实习还是校招,薯薯在搜推实习生的二面。参考下难度 ฅ˙Ⱉ˙ฅ
点赞 回复 分享
发布于 01-09 08:11 北京
怎么感觉好像在xhs看过一样的帖子
点赞 回复 分享
发布于 2024-11-20 03:12 安徽
大佬大概投递完几天收到一面通知呀
点赞 回复 分享
发布于 2024-11-13 18:13 北京
佬HR面后多久oc的呀
点赞 回复 分享
发布于 2024-11-07 22:50 福建

相关推荐

- 飞书,开视频,面试官很友好,主要是让我在做整体流程的介绍,然后问了些常规八股- 第二个手撕在同一个小时的细节上没有完全撕出来,解决了90%,整体思路没问题- 3.6投递 3.20一面 3.24感谢信- 八股基本上都秒了,项目也讲清楚了,sql也都是秒的,也不懂为啥就挂了## 项目- 先那就挑一个你觉得做的最好的一个入仓的离线数仓的项目,具体讲一讲。从业务的背景,它的业务过程,你在其中做了什么内容,最后取得了什么成果这种思路展开讲一下。- 那你从业务的视角就是说是他比如说你的你的业务过程到底有哪些业务过程它有哪些数据,然后你怎么去做建模的,然后这种方式再细一下说一下。- 这个指标的话,其实你做了多少,做了哪些表,然后他的力度是什么?然后又有什么维度呢?- 在做这个指标的时候,你这整个的数据链路是啥?从离线到从是从线上到离线,然后再到你的指标,最后是大盘这种(大盘应该指的就是可视化)  - 我应该多讲一下数据通路中用到的数据同步工具- 你设计的DWD、DWS它的粒度是什么?都有哪些维度呢?- 你在做这个数仓其实是要类数仓的这样一个项目的话。那其实你觉得这里面最最难的点是在什么- 你现在的话其实更多的是接业务方需求,比如说业务方来一个需求做一个表,来个需求做一个表,那你的数据你的表就会越来越多越来越多。这跟是数仓的这种兼容和扩展影响不是很大吗?你这个是怎么考虑的?- 数据倾斜问题## 八股- 数仓建模的一般流程你知道吗?- 刚才提到你说总线矩阵,那总线矩阵的就是说横坐横轴跟纵轴都是什么?- ODS、DWD、DWS它的定位- ODS里面已经有了这个数据,为什么不直接从ODS里面去取还要再新建一个DWD呢?- Spark里面就是说它的一个优化的方法,你这边都用过哪些?- 小表join大表的话,是小表在前还是大表在前?- MR中MapTask个数和ReduceTask个数由什么决定?- Row number和rank的区别- avg函数他在算这种平均值的时候会忽略null吗?  - **`AVG` 函数的分母是有效数值的数量**## 手撕- SQL:学生成绩平均值问题和>60的问题,很简单- SQL:直播间同一天同一个小时内最大在线人数
MinJerous:有同学已经接了offer,不需要后续推进了。或者没hc了,还有就是很少,需要排序进三面(ld)
查看20道真题和解析
点赞 评论 收藏
分享
评论
15
79
分享

创作者周榜

更多
牛客网
牛客企业服务