滴滴大数据研发实习(已OC)
3.31 一面 27min
自我介绍
聊了会儿天,确认我的实习时间
职业规划是什么
项目介绍,为数不多让我把两个项目都介绍一下的
数仓分层的好处
项目中如何保证数据可靠性的?
项目中任务如何调度的?(crontab 定时脚本)
这样的任务调度有问题吗?该如何优化
spark的优化
sql:给定一个学生成绩表
- 列转行
- 求课程成绩的排序
反问:
部门业务和技术栈
对实习生的要求是什么
多久出结果
下午2点面,下午5点通知一面通过,约4.1二面
4.1 二面 30min
自我介绍
谈谈自己想做的一个方向(面试官详细的给我介绍了数据相关的一个体系)
掌握的技术,做过实时的项目吗?(回答没有,但了解一点)
了解实时相关技术的程度?
项目中数据可靠性怎么验证的?
项目中有遇到什么问题吗?如何排查解决的
目任务调度?
场景题:真实线上可能有很多任务,若有任务未按时间产出如何排查解决?
使用过调度工具吗?
你觉得如何来对数据产出进行评估(大致是这个意思,我可能描述不是很准确)
sql
给定一张表 event_id,user_id,timestamp
- 若相邻时间差在10分钟之内,则属于同一个session,求每条数据的session_id
- 基于1,求路径。例如,001,2,2025-09-08,1;002,2,2025-09-09,1;
需要输出001,2,2025-09-08,1,001;002,2,2025-09-09,1,001:002;
第二题没撕出来,但是跟面试官说了一个思路,后面搜了下思路是对的。但是面试官让我再想一种办法,没想出来
反问:
部门业务的开发流程
面试表现有哪些不足的(面试官又帮我分析了下,还教我如何去学习相关知识)
面试官都很好,二面面试官还帮我梳理学习路线,未来的职业规划等
面完可能一小时左右,通知面试通过,问是否接受offer
4.2 下午发offer
无实习四非能有offer已经很满足了,顺便问一下有没有也是4.8号入职的朋友