大数据开发内容太多了,我到底应该怎么学?(附应届生学习路线)

背景:

有很多小伙伴找老刘讨论大数据开发相关内容,第一句往往是:”大数据内容太多了,我到底应该怎么学习大数据开发“。

有这种困惑是很正常的一个情况,尚硅谷它免费分享出来的大数据学习视频有109.60G,有18个文件夹,很多人看到这么多技术直接懵了,脑子里冒出无数个问题:

  1. 我是应该全部学习呢?还是挑部分学习?

  2. 如果全部学习,时间够吗?来得及复习吗?

  3. 挑部分学习,挑哪部分学习呢?

  4. 大数据开发不知道怎么学,不知道哪些是重点?

  5. 学了后不知道企业中怎么开发?怎么用?这点很让人烦恼!

  6. ......

老刘当初作为一个初学者,和这些小伙伴想的一样,天天愁眉苦脸,到底该怎么学,能不能学好找到工作,企业中怎么应用学的知识,脑子里全是乱七八糟的东西!

现在快毕业了,回想起这段时光,真想给自己几下,在没用的事情上浪费了太多时间,所以老刘趁着这段空闲时间给应届生好好讲讲如何高效准备大数据开发,如何不让自己迷茫!

正文

面对这么多的大数据组件如何学习?把每一个都掌握吗?

这个想法有点疯狂,一个组件花费一个星期学习,那18个组件就需要花4个半月。

但我们能保证一个星期内掌握一个组件吗?

老刘感觉一个星期的时间对大多数组件来说只是接触了一个皮毛,不能保证有应用能力。我们到企业中是要干活的,要有输出,要有应用能力,没有应用能力,是很危险的一件事!

(如果有人能在4个半月完全掌握,就当我没说哈,特殊情况特殊对待)

那我们应届生如何破局,在一定的时间内高效学习大数据开发技术呢?

应届生的秋招面试关注点更多在于基础,有扎实的基础,才能说明自己的学习能力和可塑的空间。

企业招我们进去工作,可以给我们安排这个岗位,也可以给我们安排另一个岗位,是因为他们觉得我们学习能力强,基础好,有着可塑空间,学这个学的也快,学那个学的也快!

所以我们要有扎实的基础,包括:Java编程基础知识、计算机网络知识、操作系统知识、大数据部分组件基础知识,甚至我们都可以不具有大数据部分组件知识,有一些公司招聘大数据开发岗位都不问大数据问题,只问Java基础知识、计算机网络知识、操作系统知识,因为这些公司基础平台做得好,已经不需要我们了解底层大数据知识,我们只需知道我们的岗位是什么,在企业中怎么干,加上扎实的基础就OK了。

有些公司在面试过程中不问大数据相关问题是真的,大家看看字节、网易、华为、阿里的实习招聘要求,如图所示:






它们都有一个共同点,熟练掌握Java、SQL,大数据组件算做加分项,也就是我们最起码要有扎实的Java基础。

在Java基础中,面试官一般会问一些常见的原理性问题,例如:

这是某位大数据开发大佬给我说的内容,我希望大家能够通过这张图明白基础的重要性!

挑部分学习,挑哪部分学习呢?

如果我们具备了扎实的Java基础,还有多余的时间,那完完全全可以去挑部分大数据组件学习,但大数据组件实在是太多了,挑哪部分学习最好?

由于网上能搜到的免费大数据项目大多数都是数据仓库项目,我们完完全全可以根据数据仓库涉及到的组件进行学习!

数据仓库分为离线数据仓库和实时数据仓库,离线数据仓库的难度比实时数据仓库小,掌握花费的时间也比实时数据仓库少,所以老刘先从离线数据仓库讲解一下学习内容。

离线数据仓库的学习路线如下:

  1. Java基础、Linux系统、shell编程

  2. MySQL的用法和原理

  3. Hadoop基础系列(HDFS、MapReduce、Yarn、Zookeeper)

  4. Hive的原理、用法、相关调优

  5. Spark/Scala的原理、用法、相关调优

  6. 数据仓库建模管理的相关概念

  7. 离线数据仓库练习

大家可以从网络上找到这些组件的免费学习资料,根据这些学习资料掌握这些组件!

老刘去年也是根据这个学习路线学完了离线数据仓库,相关组件并不是很多,每天早起晚睡疯狂背原理很快就能掌握!

接下来是实时数据仓库内容,实时数据仓库组件较多,难度较大,学习时间有点长,如果大家学习完离线数据仓库相关内容,还有多余的时间,可以学习一些实时数据仓库组件,不一定非要做一个实时数据仓库项目!

实时数据仓库的学习路线如下:

  1. Java基础、Linux系统、shell编程

  2. MySQL的用法和原理

  3. Hadoop基础系列(HDFS、MapReduce、Yarn、Zookeeper)

  4. Hive的原理、用法、相关调优

  5. Spark/Scala的原理、用法、相关调优

  6. 数据仓库建模管理相关概念

  7. 离线数据仓库练习

  8. SparkStreaming的原理、用法、练习

  9. Kafka的原理、用法、调优

  10. Flink的原理、用法、练习

  11. HBase的原理、用法、调优

  12. 实时数据仓库练习

很明显,实时数据仓库的学习内容是在离线数据仓库的基础上进行了扩展。根据这个学习路线,如果有足够的时间,完完全全可以学习完,但没有足够的时间,老刘建议学学Kafka、Flink这几个就行了。需要补充的是这些学习资料都可以在网上找到免费的,大家不要担心学习资料的问题。

学了后不知道企业中怎么开发?怎么用?

总是担心这个问题是非常正常的一个情况,大部分人没有经历过实习,只是学了一身本领,还没地方施展自己的抱负,害怕自己的本领无法发挥出来!

但对于应届生来说,基础最重要,基础不牢地动山摇,而且在实习期,在别人的带领下,我们可以凭借扎实的基础,快速学习快速上手快速掌握。

举个例子,老刘所在的华为部门,今年组织了一个提前学习小组,给我们分享了Java基础学习视频、华为Java编程规范、开发者测试快速入门等良心学习资源,老刘最后获得了学习之星、优秀学员、优秀学习小组三个奖励,全是靠自己平时的积累加快速学习的能力,所以老刘希望大家不必过于担心,该学的学该吃的吃该喝的喝该玩的玩!

总结

本文全篇就强调了一点:基础,只要我们牢牢掌握了基础知识(Java基础、计算机网络、操作系统、大数据基础这几个),我们压根不用担心找不到工作,希望大家明白基础的重要性,把基础打牢!(老刘已经强调无数遍了

老刘为了这篇文章准备了很久,但因为毕业相关事情一直拖着,今天终于能发出来了,希望可以帮助到同样想找大数据开发的应届生或者大学生!

最后,请给老刘点个赞!


#大数据#
全部评论
老刘讲的真好😜
5 回复 分享
发布于 2022-06-06 10:12
讲得真好
1 回复 分享
发布于 2022-06-06 12:24
很强的理论知识,老刘棒棒哒
1 回复 分享
发布于 2022-06-13 23:20
老刘同志通过大厂的招聘要求,简略讲了小白进击之路,以点概面,确实是大师级别😁
1 回复 分享
发布于 2022-06-13 23:32
点赞 回复 分享
发布于 2022-06-12 16:44
大佬就是大佬,讲的很透彻,让我醍醐灌顶
点赞 回复 分享
发布于 2022-06-13 23:43
大佬,我想请问一下关于HDFS、MapReduce、Yarn以及Hive这些组件有没有好一点的文字资料推荐,在B站上看视频学起来感觉速度有点慢
点赞 回复 分享
发布于 2022-06-29 15:20
西安有大数据岗位吗
点赞 回复 分享
发布于 2022-07-01 07:28
大佬,我们学校开的最优化理论和分布式并行计算在大数据的运用是什么😽
点赞 回复 分享
发布于 2022-07-09 21:31
说实话,我现在上班的感觉就是sqlboy,因为大数据平台已经帮你吧别的事情都做好了😂
点赞 回复 分享
发布于 2022-07-15 00:15
我还没学spark,就学了hadoop,zookeeper,hive,hbase,kafka,flume,这能找到工作吗😂😂
点赞 回复 分享
发布于 2022-07-15 11:43
老刘老刘,自学的话电脑内存8G够吗?我感觉我买小了😂😂😱
点赞 回复 分享
发布于 2022-07-17 01:58
老刘在哪家公司呀😁
点赞 回复 分享
发布于 2022-07-20 12:05
如果是准备java转大数据的要怎么造呢😂数仓或者实时数据两个方向
点赞 回复 分享
发布于 2022-07-21 21:34
老刘讲的真好
点赞 回复 分享
发布于 2022-09-12 19:52 湖北
刘老师,请问有基础知识的学习资料么
点赞 回复 分享
发布于 2023-02-08 13:56 浙江
老刘,请问Java基础包括哪些部分呢
点赞 回复 分享
发布于 2023-02-27 11:26 广东

相关推荐

宁波舟山港 舟山港务 第一年12w,第二年13w,实习期8k,转正后也是8k
丨桃花丨:楼主,这家在哪投的啊,官网好像都没有看到投递渠道,线下校招的吗
点赞 评论 收藏
分享
各位大佬,后辈目前研1,专业是金融科技,本科学的是应用统计跟应用数学,求职方向是数分,有两端数分实习,一段是上市快消公司的一段是电子产品领域的跨境电商公司因为数分现在实在太卷了,加上之前面试数分实习的时候,罕见的遇到了不止一家公司问是否有数仓使用经验,都以我沉默答不上而宣告失败。痛定思痛后我决定补充数仓知识同时把数仓作为并行求职路线本科的时候接触过python,sql,实习也干过写sql,做报表,Bi可视化,写python数据处理脚本这些工作内容,但是没有大数据组件使用经历。从九月开始跟网课学,现在学了hadoop,hive,spark三个大组件,还有zookeeper和kafka,现在正在做一个离线数仓项目(hive + pyspark)想请教一下大佬们有人也是应用统计转数仓的吗?这样做前景如何?以及目前我预计下周五之前做完项目,做完项目之后应该做哪些准备呢,是直接开始背大数据组件的相关八股?如果不找实时岗位,flink一定要学吗?另外,我咨询过不同的信息渠道,有些前辈说大数据可以用python解决,有些前辈说还是得学java,请问有前辈可以就这个问题答疑解惑吗?面试的时候,八股文部分考核,是聚焦大数据组件的八股,还是也会出现计算机网络,操作系统这些计算机专业科班才会接触的内容呢(如果是后者那恐怕应统专业是要跟大数据无缘了)#数据人的面试交流地##牛客在线求职答疑中心##你后悔选择现在的专业吗#
Markovo:不投实时可以不用学flink,数仓就是写hql,java都很少用到
点赞 评论 收藏
分享
63 214 评论
分享
牛客网
牛客企业服务