小红书数据开发timeline

08.07 投递

08.19 笔试

09.02 一面、二面

一面
1.自我介绍
2.介绍实习内容,深挖
3.介绍一个项目,深挖
4.实时了解吗
5.一道sql题
6.反问
结束约二面

二面
1.自我介绍
2.介绍实习中的数据建设链路
3.涉及的数仓、存储组件
4.不是计算机,对大数据了解什么
5.mapreduce的原理
6.group by与distinct的区别(从mapreduce的角度解释)
7.无手撕
8.反问

9.6 hr面试
1.自我介绍
2.介绍一个实习中印象深刻的项目
3.难点是怎么解决的
4.优点与缺点
5.对小红书的了解
6.反问

9.14 意向
全部评论
请问是在哪个平台投递的啊,谢谢
点赞 回复 分享
发布于 2023-12-16 18:57 辽宁
请问小红书数据开发笔试考的什么呀
点赞 回复 分享
发布于 2024-06-06 22:38 福建

相关推荐

2024.12.23(一面)一面 (1h 5mins)- 实习拷打  - 快手-评论模版留存率(10 mins)    - 严格漏斗和非严格漏斗的区别  - 字节-链路改造优化    - 延伸:数据的时效性怎么保证(从整体和单点分别叙述)    - 延伸:优化任务的思路    - 延伸:并行度相关的改法(三种)    - repartition()能改变第一个stage的shuffle write的并行度吗?    - 第一个stage的shuffle write的并行度由什么决定?  - 字节怎么分的数据域  - 字节分了哪些主题域  - 数据域和主题域的区别(主题域:自上向下,从分析的角度划分)  - 分层的意义(复用性和一致性)  - 怎么考虑分层,该分多少层(直接说了没必要在意这个,要理解分层的本质,面试官表明说的也有道理,也抛了另一个观点:肯定要分层,需要有不同粒度的数据,每个人在意数据都不同,比如说老板在意汇总层的数据,数分可能更在意明细层的数据,另外,在做归因分析的时候也需要血缘追踪)- SQL题二面 (26 mins)全程实习拷打- 自我介绍- 字节实习  - 多机房代码一致性怎么保证的(治理存量,增量通过oceanus)  - 多机房涉及到的网络问题(通过全球化数据迁移解决)- 快手实习  - 评论模版留存率    - 严格漏斗和非严格漏斗的区别(准确性和计算量之间的取舍)    - 为什么这样设计    - 最终的目的是什么    - 有没有想过通过抽样解决数据量大的问题- 反问
查看18道真题和解析
点赞 评论 收藏
分享
评论
3
13
分享

创作者周榜

更多
牛客网
牛客企业服务