数据开发饿了么/淘天/快手/京东

京东校招内推码: C4K4D

最近面试强度上来了...两天四场

饿了么一面(40min):
介绍下实时项目
对DWD和DIM层的理解,构建过程(背了套理论,面试官听笑了..)
开发DWS层的目的(避免重复建设,数据一致性)
Hive倾斜优化
kafka底层数据存储(log文件分段,稀疏索引,mmap,零拷贝)
flink状态
flink checkpoint作用
一道sql题
没实习被diss了,面试官说做数仓的话更看重对业务的理解深度

淘天一面(25min):
聊了会项目
对数仓的理解,对分层的理解
kafka exactly once、如何保证有序
(broker缓存生产者端发送的request并进行排序,单分区有序,ack级别-1,幂等,2PC,隔离级别,消费者端事务性消费数据与提交offset)
sql:求最大连续登录天数(两种解法)
能不能提前去实习

快手一面(1h):
之前面别的部门一面挂..捞面了
两道leetcode
1.在非降序数组中找到目标数的开始和结束位置(二分,最近面试做过不下三次了)
2.恢复ip地址(dfs,思路对,但没调出来,面试官让面完再调调,发他邮箱,感恩!)
实时项目,数据更新和变化了,会发生什么,如何处理
java 线程等待
synchronize和reentrantlock的区别
wait和notify如何调用,为什么放在Object里
看过什么源码
mysql隔离级别,读已提交和可重复读是怎么实现的,可重复读如何解决幻读
flink状态有哪几种,算子状态有哪几种(脑子抽了答Mapstate,其实没有..),状态后端有哪几种,哪种性能好

京东二面(30min):
属于实时处理架构的团队,应该是主管。
自我介绍完,面试官附和了句大黑山脚下,感觉像校友。
深聊项目细节,技术的选型,区别,底层原理
更喜欢踏实的、能自驱的候选人
问了有无offer,面了几家公司
有一说一,遇到的三个京东面试官都很好,许愿一个京东的hr面!

感觉半个小时的面试算是比较舒服的时间,超过40min的有点顶不住。

下一届求职的朋友们,电商离线数仓尽量换别的做吧,面试官看腻了都hh
全部评论
明天京东二面好慌,感觉有的聊天,有的就问很难的八股
点赞 回复 分享
发布于 2023-08-29 22:21 广东
老哥快手是啥部门呀
点赞 回复 分享
发布于 2023-08-30 01:21 湖北
岗位大数据开发和数仓是一个意思吗
点赞 回复 分享
发布于 2023-08-30 12:19 浙江
老哥京东这个组是做基础架构的吗
点赞 回复 分享
发布于 2023-08-31 17:53 香港
举报了哥,京东二面完了挂了
点赞 回复 分享
发布于 2023-08-31 18:44 江苏
大黑山脚下哈哈哈,校友是硕士还是本科
点赞 回复 分享
发布于 2023-08-31 18:52 上海
来看看南京满帮啊,美股上市公司,流程快薪资高
点赞 回复 分享
发布于 2023-08-31 20:59 江苏
佬,为什么面试都不问你spark呀,是简历上没写吗?
点赞 回复 分享
发布于 2023-08-31 21:07 上海
大佬有大厂实习吗
点赞 回复 分享
发布于 2023-09-12 17:02 江苏
uu京东有后续了吗
点赞 回复 分享
发布于 2023-09-15 17:27 辽宁

相关推荐

分享一下我在大数据方向的学习路线,列出的基本上是必须掌握的内容。对于项目方面,建议先离线后实时项目,再之后便是数据湖等项目。另外推荐《大数据之路》这本书,里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章,源码等。比如:阿里的学习文档、美团的技术文档等,在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。1. Java:JAVA SE、JVM、JUC(刚开始只需要看Java基础就可以,不要花太多时间在Java的学习上,也不需要学习一些web框架,因为不管是源码二次开发,UDF开发,还是数仓都不需要用到这些框架,除非涉及到数据平台开发。2. Linux+Shell,熟悉基本操作即可3. Git、Maven(了解会用,如果需要使用能快速学习上手使用即可)4. Hadoop(重点,HDFS,MapReduce,Yarn)5. Zookeeper6. Hadoop高可用(了解即可)7. Flume8. Kafka(重点,时间紧张的话可以大致了解用途,后面可以和Flink一起学,主要用来处理实时数据)9. Hive(重点,需要熟练了解原理,并且会写HQL,以及一些优化,是基础)10. Spark(重点,大部分公司都是写SparkSQL,并且调优,需要明白底层原理,内存结构,SparkUI等,来不及的话可以先跳过Java API编写Spark代码的学习)11. Maxwell、DataX、DolphinScheduler(项目中数据同步、模拟日常调度工作)12. 离线数仓项目:sgg电商数仓6.0(跟着做完这个项目,就知道数仓、维度模型、指标体系等等,以及生产中一些内容。这套教程比较全面,若来不及可以选择sgg其它离线数仓项目)。学到这里可以去找实习,实时数仓等技术可以在实习中抽空学13. Flink(重点)14. MPP架构(如:Doris、Clickhouse、StarRocks)15. 实时数仓项目16. 数据治理17. 数据湖、湖仓一体18. 刷算法、刷sql、刷场景题 #数据开发工程师# #秋招#  #春招#  #实习#  #大厂#
投递美团等公司10个岗位
点赞 评论 收藏
分享
评论
7
60
分享

创作者周榜

更多
牛客网
牛客企业服务