一拳打在棉花上

01-21 13:08 华中师范大学大数据开发工程师发布于江苏

关注

数据开发学习路径（本人亲测）

分享一下我在大数据方向的学习路线，列出的基本上是必须掌握的内容。对于项目方面，建议先离线后实时项目，再之后便是数据湖等项目。
另外推荐《大数据之路》这本书，里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章，源码等。比如：阿里的学习文档、美团的技术文档等，在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。

1. Java：JAVA SE、JVM、JUC
（刚开始只需要看Java基础就可以，不要花太多时间在Java的学习上，也不需要学习一些web框架，因为不管是源码二次开发，UDF开发，还是数仓都不需要用到这些框架，除非涉及到数据平台开发。
2. Linux+Shell，熟悉基本操作即可
3. Git、Maven（了解会用，如果需要使用能快速学习上手使用即可）
4. Hadoop（重点，HDFS，MapReduce，Yarn）
5. Zookeeper
6. Hadoop高可用（了解即可）
7. Flume
8. Kafka（重点，时间紧张的话可以大致了解用途，后面可以和Flink一起学，主要用来处理实时数据）
9. Hive（重点，需要熟练了解原理，并且会写HQL，以及一些优化，是基础）
10. Spark（重点，大部分公司都是写SparkSQL，并且调优，需要明白底层原理，内存结构，SparkUI等，来不及的话可以先跳过Java API编写Spark代码的学习）
11. Maxwell、DataX、DolphinScheduler（项目中数据同步、模拟日常调度工作）
12. 离线数仓项目：sgg电商数仓6.0（跟着做完这个项目，就知道数仓、维度模型、指标体系等等，以及生产中一些内容。这套教程比较全面，若来不及可以选择sgg其它离线数仓项目）。学到这里可以去找实习，实时数仓等技术可以在实习中抽空学
13. Flink（重点）
14. MPP架构（如：Doris、Clickhouse、StarRocks）
15. 实时数仓项目
16. 数据治理
17. 数据湖、湖仓一体
18. 刷算法、刷sql、刷场景题
#数据开发工程师#
#秋招# #春招# #实习# #大厂#

全部评论

推荐最新楼层

华南师范大学 Java

求一下资料，研一迷茫中

点赞回复分享

发布于 02-02 13:39 贵州

01-23 18:09

牛客_技术部_大数据工程师

如何成为一名大数据工程师?

#牛客AI配图神器#大数据工程师需要掌握多方面的技能，涵盖技术、工具、架构设计以及软技能。以下是一个系统的技能框架，适用于不同阶段的学习和实践：一、基础技能编程语言Java/Python/Scala:Java（Hadoop生态的核心语言）、Python（数据处理/分析常用）、Scala（Spark开发首选）。SQL: 熟练编写复杂查询，优化数据库性能。Shell脚本: 自动化运维和任务调度。数据结构与算法分布式场景下的算法设计（如分治、哈希、一致性算法）。大数据场景的复杂度分析（如时间、空间、网络开销）。二、分布式系统与计算框架Hadoop生态HDFS: 分布式文件存储原理、读写优化。MapR...

点赞评论收藏

分享

01-29 12:16

门头沟学院 Java

java后端还是数据开发(数仓)?

9本在读大二统计学专业，成绩平平无法保研也不太想花大精力考研或者花大钱读海硕，目前0科研0实习，在纠结怎么选本科就业的方向，准备27届秋招。本专业对口数分商分岗，一些研究生会转去做算法，有部分会转金融。自己一方面对金融商科不太感兴趣，另一方面数分商分算法这些感觉一般都卷到要读研，所以想考虑java后端或者数据开发(数仓)，短期计划是学习半年左右今年暑假找第一份实习。java后端优点:岗位需求较大，未来职业发展空间较大，学习资源丰富缺点:工作辛苦压力大难度大(相对数仓)，卷度很高很多科班都在卷，自己属于非科班会被质疑，担心卷不过找不到合适工作数仓开发优点:学习内容相对少，要求低(大部分写sql)，专业勉强算对口，工作压力小缺点:比较边缘，岗位需求少，未来发展有点迷学校的课大部分偏理论，自己有过一点python和C的基础，上过sql的课，目前在学javase了，球球大家给点意见，或者推荐其它适合的方向，和我情况类似的小伙伴也可以来一起交流😢

点赞评论收藏

分享

02-02 15:37

门头沟学院数据分析师

月薪 3 万 + 大数据开发岗，技能与自我介绍全解析

一、岗位技能要求大数据开发工程师需要掌握的技能栈非常广泛，既要熟悉各种编程语言和大数据框架，又要具备良好的数据处理、数仓开发、分布式系统和云计算等方面的知识。以下是该岗位通常看重的技能：1. 编程语言Java：Java 是大数据开发中应用最广泛的编程语言之一，许多大数据框架，如 Hadoop 的 MapReduce 和 Hive 的 metastore 等，都是用 Java 编写的。因此，熟练掌握 Java 语言的基本语法、面向对象编程思想、集合框架、多线程编程等是大数据开发工程师的必备技能。实例：在 Hadoop MapReduce 编程中，我们需要使用 Java 来编写 Mapper 和 ...

大数据从入门到精通-最全...

点赞评论收藏

分享

01-29 08:16

已编辑

门头沟学院大数据开发工程师

面经｜快手-数据开发实习

2024.12.23（一面）一面 （1h 5mins）- 实习拷打  - 快手-评论模版留存率（10 mins）    - 严格漏斗和非严格漏斗的区别  - 字节-链路改造优化    - 延伸：数据的时效性怎么保证（从整体和单点分别叙述）    - 延伸：优化任务的思路    - 延伸：并行度相关的改法（三种）    - repartition（）能改变第一个stage的shuffle write的并行度吗？    - 第一个stage的shuffle write的并行度由什么决定？  - 字节怎么分的数据域  - 字节分了哪些主题域  - 数据域和主题域的区别（主题域：自上向下，从分析的角度划分）  - 分层的意义（复用性和一致性）  - 怎么考虑分层，该分多少层（直接说了没必要在意这个，要理解分层的本质，面试官表明说的也有道理，也抛了另一个观点：肯定要分层，需要有不同粒度的数据，每个人在意数据都不同，比如说老板在意汇总层的数据，数分可能更在意明细层的数据，另外，在做归因分析的时候也需要血缘追踪）- SQL题二面 （26 mins）全程实习拷打- 自我介绍- 字节实习  - 多机房代码一致性怎么保证的（治理存量，增量通过oceanus）  - 多机房涉及到的网络问题（通过全球化数据迁移解决）- 快手实习  - 评论模版留存率    - 严格漏斗和非严格漏斗的区别（准确性和计算量之间的取舍）    - 为什么这样设计    - 最终的目的是什么    - 有没有想过通过抽样解决数据量大的问题- 反问

查看17道真题和解析

点赞评论收藏

分享

01-24 18:05

浙江大学算法工程师

米塔碳大数据开发岗位面试经验分享第2弹！！！

基于上一期的问题我再进行一些补充4.Kafka 高性能原理为什么 Kafka 速度快？ 答案通常涉及顺序读写、零拷贝、页缓存等。-回答： 用直观语言说明 Kafka 的顺序写特性，以及操作系统页缓存对性能的提升作用。削峰和解耦的具体实现？-回答：用自己的话讲一下如何通过调整生产者的 batch.size 和 linger.ms 来削峰，以及如何通过消费者组实现解耦。5.Hudi 与数据湖Hudi 表的类型有哪些？MOR 和 COW 的特点是什么？-回答：讲一下MOR和COW是什么/有什么区别。前者适合读取频繁的场景，而后者更适合写入密集的场景。是否遇到过小文件问题，如何解决？ 比...

查看6道真题和解析面试时最害怕被问到的问题

点赞评论收藏

分享

评论

2

17

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 2025开工大吉 #

14437次浏览 139人参与

# 工作一周年分享 #

7163次浏览 43人参与

# 国企vs私企，你更想去？ #

172230次浏览 1600人参与

# 大家实习每天都在干啥 #

54734次浏览 390人参与

# 实习想申请秋招offer，能不能argue薪资 #

86621次浏览 572人参与

# 通信和硬件还有转码的必要吗 #

43027次浏览 463人参与

# 嵌入式转岗的难度怎么样 #

16187次浏览 315人参与

# 聊聊这家公司值得去吗 #

180894次浏览 2038人参与

# 上班到公司第一件事做什么？ #

26042次浏览 254人参与

# 远程面试的尴尬瞬间 #

41776次浏览 427人参与

# 运营来爆料 #

21516次浏览 214人参与

# 在国企工作的人，躺平了吗？ #

302315次浏览 3758人参与

# 滴！实习打卡 #

543288次浏览 5910人参与

# 找实习多的是你不知道的事 #

1375064次浏览 18829人参与

# 我的岗位说明书 #

131348次浏览 1293人参与

# 职场萌新的疑问 #

45979次浏览 200人参与

# 你遇到过哪些神仙同事 #

37833次浏览 362人参与

# 机械人面试中的常问题 #

20489次浏览 264人参与

# 晒出你年味最浓的照片 #

3242次浏览 82人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

57200次浏览 447人参与

牛客网
牛客企业服务