一个大数据专业学生的求职思考

#大数据##23届找工作求助阵地##数据人的面试交流地##校招#

(此文主要面向“数据科学与大数据技术”专业的学生)

不是标题党,本人真的是“数据科学与大数据技术”专业的在校生,目前在某普通211读大四,秋招运气极好上岸大厂。

回想大三开始找实习的迷茫,再看看周围同专业一些考研失利和一些找工作较晚的同学对于工作方向的不知所措,有所感想,希望对同专业比较迷茫的同学或学弟学妹们有所帮助~

对于近些年才开设的新专业,先看看有多少同道中人

(可以先滑到底部进行投票)

关于“数据科学与大数据技术”专业:

    先说说我校的情况,学校对此专业的解读是分成了“数据科学”和“大数据技术”两部分,数据科学方面会有一些数学课程,提高一些数学能力(但也学习的比较浅);“大数据技术”方面则是约等于计算机,不过底层编译原理等较为底层的没学,替换成简单的大数据技术简介和几门机器学习课程。最后的结果就是同学们高不成低不就,代码能力较弱,学习的东西看起来很高大上但实际根本无法依此就业。(个人认为让本科生研究算法是学校的一大败笔,学生的工程能力基本为零,甚至有些同学大四做毕设前电脑上还没有配过代码环境)

    不确定是不是共性问题,但求职过程中遇到过一些其他学校同专业同学,聊天中得知,他们学校对于大数据技术的课程也比较表浅,所学是远远达不到大数据方向求职所需的。

    不知不觉又絮叨了许多废话,总结一下,如果你也是“数据专业”且要走技术岗的同学,学校真的把hadoop,spark,甚至ck等专门开设成课程,那你真的很幸运,好好学,以后求职会轻松一些。

关于大数据方向的求职:

(以下内容仅个人理解,如有说的不对的地方,欢迎评论区指正,我会及时修改,请勿喷

大数据开发/研发(技术岗):

大致可以分为三个小方向

1、数仓

    本人求职方向,平日sql居多,业务导向

2、大数据基础组件研发

    处于鸡架范围,需要对相应大数据组件非常了解

3、大数据平台开发

     虽然也有大数据字样,但我理解重点是平台开发,偏向后端,需要学很多后端技术

    这些是纯正技术岗,需要手撕算法和sql,需要背Java和大数据组件的八股,学习成本相对高一点,岗位主要集中在互联网或相关大企业,大国企央企岗位较少。总共数量远不如后端

数据分析/数据科学(非技术岗):

    非技术岗,不需要较强代码能力,最多手撕sql,会较多考察数学能力和一些分析归因的能力。当然还有一些分析工具的使用,从Python到Excel,不同的职位有不同的要求。岗位数量很多,无论大公司还是小公司,都有相关岗位。更加适合不喜欢写代码,但又想从事数据相关工作的同学。

一些“胡乱”想法与建议:

对于即将毕业的同学(此专业好像很少有相关研究生,应该绝大部分是本科毕业),看看你是下面的哪一种情况:

1、我喜欢写代码,并且代码能力不弱,对大数据组件也比较了解,甚至有过相关实习

    那完全可以走大数据开发方向,会很合适。

2、我喜欢写代码,并且代码能力不弱,但对大数据组件基本没什么了解,也没有过相关实习

    这样就需要慎重考虑是否all in大数据方向了,毕竟大数据需要学习一些组件,做相关项目,时间成本还是很高的,虽然没Java后端卷,但岗位以大公司为主,小公司基本没有。all in大数据也基本等于all in中大公司(本人秋招的时候就因为方向局限,投不了多少份简历而苦恼),需要权衡利弊。或许走其他方向也是不错的选择~

3、我并不喜欢写代码,但对分析数据感兴趣

    可以考虑走数据分析方向,从小厂到大厂,从Excel工程师到数据科学家,岗位很多,总有适合你的。

附:对于即将毕业的同学,即便你是1或2,我觉得此次春招也可以投一些数据分析方向的小公司岗位来保底(毕竟做个Excel工程师并不需要学太多东西,可以在空闲时间学习一下),毕竟大数据开发岗所能投的简历数量实在不多……

做个总结:

    大数据开发方向相对比较新兴,学校的“数据科学与大数据技术”专业所学与公司所用(尤其是互联网大厂)脱轨非常严重,需要自己学习。不要妄想仅仅知道“hadoop是做离线批处理的,spark也常用作离线批处理引擎”(学校PPT原话,教的差不多到此为止,不作评价),就可以进入这个新兴的领域。如果还没到应届求职的时候,并且非常喜欢大数据技术,快努力自学找个相关实习,会对未来非常有帮助。

    而对于数分方向,由于我确实认识有限,不敢给出过多建议,欢迎各位数分数科大佬补充

    希望各位“数据科学与大数据技术”专业的同袍都能有光明的未来

有不少牛友问问题哈,可以先看下这个,看看能不能解答一些疑惑哈哈

数仓找实习或求职需要准备什么?(小白向)

#投票##数据人的面试交流地##23届找工作求助阵地##我的求职思考##在找工作求抱抱#
全部评论
讲的挺好的基本就是大数据专业目前的现状,又想技术和数学都学,但两者又都只是学了皮毛,但是时间也就这样过去了,对于没有过早意识明确一个方向的,盲目跟着学校学习的学生基本就是g。
18 回复 分享
发布于 2023-02-28 08:38 广东
找工作感想就是,读书时确定一个明确的就业方向,然后死命卷,不然找工作的时候就发现什么都搭点边,什么都不精,完蛋
12 回复 分享
发布于 2023-03-08 10:29 浙江
同大数据专业,学校开的课是真的水
4 回复 分享
发布于 2023-03-01 12:19 广东
学长我也是某211大数据专业,现在学了Hadoop,spark还有hive以及离线数仓的东西,但是对于flink实时数仓还不怎么了解,能找到暑期实习嘛
3 回复 分享
发布于 2023-03-07 11:26 湖南
楼主你好,本人也是大数据专业,我们学校关于大数据的课程大三才开设,对这个专业以及就业方向真的很迷茫,要精通什么 掌握什么基础也不是很了解。求大佬们指点一二😭
2 回复 分享
发布于 2023-06-25 16:53 贵州
大学期间考什么证比较有价值?
2 回复 分享
发布于 2023-03-01 01:39 广东
您好,我也是这个专业的学生,刚刚开始准备春招,想要学习一些面试笔试以及工作中可能用到的知识。想问下您从哪方面入手比较好呢?
2 回复 分享
发布于 2023-02-28 23:14 山西
二本文科 建议大数据呢还是嵌入式呢 真的太谢谢了 各位大佬
1 回复 分享
发布于 2023-04-07 15:47 河北
想问一下大佬,算法需要掌握到哪种程度,我想做数仓的,多说数仓算法要求一般,但到底多一般呀,我很怕手撕算法环节撕不出来
1 回复 分享
发布于 2023-03-19 14:23 上海
你好!请问数据分析(偏业务) 有哪些中厂嘛
点赞 回复 分享
发布于 2023-02-28 09:50 湖南
快来我这里
点赞 回复 分享
发布于 2023-03-26 01:30 湖南
兄弟我想问下现在后端转大数据可行吗,学历普通一本,java卷不动了,根本找不到工作
点赞 回复 分享
发布于 2023-03-09 23:35 河北
羡慕,大佬上的哪家大厂
点赞 回复 分享
发布于 2023-03-01 17:54 湖南
其实大数据读个硕士考公应该不凑吧,竞争小
点赞 回复 分享
发布于 2023-03-01 17:12 山东
楼主你好,能帮我看看数仓的一个bug吗
点赞 回复 分享
发布于 2023-02-28 22:18 江苏
走数仓方向,学习的技术栈是啊大佬
点赞 回复 分享
发布于 2023-02-28 15:31 广东

相关推荐

转码后的第一次面试,很紧张,心跳一百一。软件开发中的数据开发方向。0.应该是KPI面,基本没拷问八股和项目。回答的很烂手撕SQL也没撕出来也没考察Python 亏我力扣刷了那么久1.聊了聊数学专业相较于其他科班专业有啥优势,聊了聊对目前大模型的看法,有没有用到过。1.5.为什么选择数据开发这个领域。怎么看数据分析和数据开发的。2.简单询问了第一个项目(我项目很烂 下一步要开点新项目做),做项目的背景,我含糊其次的回答了一下(做项目的背景就是为了面试啊喂)3.问了问对数仓有什么了解,知不知道分层啥的。我回答了四个分层,说了说星型模型和雪花模型啥的。4.再往后就是问我SQL怎么样,做个题吧。你都说了,那就做吧。没有示例,只有描述,感觉很抽象,也没有运行,就生写。感觉第一问写对了,第二问没搞出来。然后他就让我讲讲做题思路。5.啥也没说了。反问:1.需要补足的技术栈2.Python在数据开发中的占比(这场面试基本上没问我Python)面试官回答Python在数开中不如SQL常用,应该把重点放SQL上。准备的Hadoop这样的大数据八股都没用上,或许是准备方向不太对吧。项目也不好,确实是准备的不充分。还是差的太多了。真的该重新思考一下该做些什么了😮‍💨。恳请希望路过的牛油们给点建议,什么建议都可以。#我的失利项目复盘# #美团求职进展汇总# #牛客AI配图神器#
点赞 评论 收藏
分享
二月底那会tx约面过我一次,结果我当时第一次被约面没经验,当时上着课,就想着先挂了等会打回去,结果发现是虚拟号打不回去一天后喜提流程结束字节oc了之后又收到了约面电话,不过我意向部门是cdg,约面的是pcg。想到之前还没面过tx,于是就接了尝尝鲜,所以就有了今天的面试一上来面试官迟到了十分钟1. 自我介绍2. redis存商品库存用的什么数据结构?3. 怎么保证原子性?4. redis如何配置?集群还是主从?(从这里就是拷打的开始)5. 如果你主节点完成操作了,从节点还没同步,主节点就挂了怎么办?6. 看我回答的不好,于是问我主从同步的方式的底层原理。我说了全量同步、增量同步,面试官说我没答到点上7. 又问我知道kafka生产者将消息发送给broker的三种方式吗?汗流浃背了,说了生产者发送→broker刷盘→返回ack→生产者收到ack的过程,面试官说这是其中的一种8. 面试官说,你不了解主从同步的原理,所以你实现不了高可用。又问我如果broker返回ack后挂了,副本还没同步就变成主节点导致的消息丢失怎么办(其实和5差不多)。我说我猜一下,于是类比了mysql的同步机制,说让副本读主节点的日志。被面试官否了,说主节点挂了是没法读它的日志的。见我不懂,就给我讲了几种同步策略,比如选出和broker的offset最接近的几个副本作为候选集,将候选集同步完成后才会真正视为刷盘成功并返回ack;比较严格的模式就是强制同步所有副本。具体还要根据业务来选9. 面试官看我用了雪花算法,于是问时钟回拨怎么解决。我说可以参考美团leaf,引入zk,生成前比较当前时间和此前最后生成id的时间。面试官反问我你引入这么重的一个东西合适么?你这样做损坏了它本身的高性能的优势。我说那可以使用号段模式。预先生成一批id存起来,使用的时候去取,也被面试官否了,说这样做也不是一个好的策略。10. 然后面试官看了看表,说自己三点还有一场面试,后面得加快速度。于是就开始迅速问一些八股,要求必须快速答出关键部分赶紧下一题:11. 进程和线程的区别12. 线程有自己的堆栈吗13. 线程通信的方式14. 乐观锁了解吗15. 线程池由哪些部分组成16. 你自己使用的哪种拒绝策略?17. 核心线程数怎么设置?理由是什么18. 大量出现time_wait有哪些可能的原因?答了一些,面试官不断问还有吗还有吗,最后说想不出来了19. 一个很大的表查询很慢怎么优化?把分库分表、sql语句优化、索引、innodb调优等角度都说了一遍,面试官继续追问还有吗,我说检查脏页是否过多,继续问还有吗,我说想不到别的了20. 分库分表的底层原理了解吗?我说沙丁jdbc,或者用中间件,面试官不想听,只想听底层原理。回答不太熟悉手撕:此时距离三点还有不到10分钟。一开始出了道二维矩阵中第k个最大值,矩阵中的元素符合按行递增和按列递增。面试官问我觉得这题难度怎么样,我说你想要n方logk的算法我现在就能写,但是要n方的话我得想一想。面试官等不及,于是换成了一维数组。直接优先队列三分钟秒了反问:我需要加强哪些方面(了解底层原理并实际运用的能力)总结:感觉大概率会挂,被挖的很痛但是一些问题面试官主动给出了讲解,冲这点其实也不亏了。可惜由于对方时间紧迫,有些我不懂的点没有来得及讲了,尤其是雪花算法的最佳实践那里,成了永远的遗憾-------------更新:一天后流程结束#互联网回暖,腾讯要招5000人!# #软件开发笔面经# #牛客创作赏金赛#
ailanxier:迟到10分钟是因为上一个也是拖堂了吧
点赞 评论 收藏
分享
评论
44
119
分享

创作者周榜

更多
牛客网
牛客企业服务