同0 offer,准备转测开
点赞 3

相关推荐

分享一下我在大数据方向的学习路线,列出的基本上是必须掌握的内容。对于项目方面,建议先离线后实时项目,再之后便是数据湖等项目。另外推荐《大数据之路》这本书,里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章,源码等。比如:阿里的学习文档、美团的技术文档等,在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。1. Java:JAVA SE、JVM、JUC(刚开始只需要看Java基础就可以,不要花太多时间在Java的学习上,也不需要学习一些web框架,因为不管是源码二次开发,UDF开发,还是数仓都不需要用到这些框架,除非涉及到数据平台开发。2. Linux+Shell,熟悉基本操作即可3. Git、Maven(了解会用,如果需要使用能快速学习上手使用即可)4. Hadoop(重点,HDFS,MapReduce,Yarn)5. Zookeeper6. Hadoop高可用(了解即可)7. Flume8. Kafka(重点,时间紧张的话可以大致了解用途,后面可以和Flink一起学,主要用来处理实时数据)9. Hive(重点,需要熟练了解原理,并且会写HQL,以及一些优化,是基础)10. Spark(重点,大部分公司都是写SparkSQL,并且调优,需要明白底层原理,内存结构,SparkUI等,来不及的话可以先跳过Java API编写Spark代码的学习)11. Maxwell、DataX、DolphinScheduler(项目中数据同步、模拟日常调度工作)12. 离线数仓项目:sgg电商数仓6.0(跟着做完这个项目,就知道数仓、维度模型、指标体系等等,以及生产中一些内容。这套教程比较全面,若来不及可以选择sgg其它离线数仓项目)。学到这里可以去找实习,实时数仓等技术可以在实习中抽空学13. Flink(重点)14. MPP架构(如:Doris、Clickhouse、StarRocks)15. 实时数仓项目16. 数据治理17. 数据湖、湖仓一体18. 刷算法、刷sql、刷场景题 #数据开发工程师# #秋招#  #春招#  #实习#  #大厂#
投递美团等公司10个岗位
点赞 评论 收藏
分享
01-23 14:53
已编辑
东南大学 Java
时长1h10min,其中算法10min自我介绍一下1.非科班转码原因,本科学过JAVA相关课程吗2.除了java还用过什么语言3.说说JAVA和Python的区别4.说说对JAVA多态的理解5.知道synchronized关键字吗6.说说volatile关键字的作用7.spring和springboot的区别8.注解的原理是什么9.项目里配置的jvm垃圾回收器是哪个,用到哪些jvm垃圾回收的算法10.mysql给了一个表头,问各个数据类型应该要设置成什么11.id设成了int类型,表中最多可以放多少个数据。12.数据太多怎么办,表放不下了13.分表具体应该怎么分14.如果mysql查询速度很慢,怎么排查这个问题15.索引失效场景有哪些16.索引为什么快17.看你项目里用了分布式锁,那你了解redis里的redlock吗(说不太了解,让我回去了解一下)18.redis想实现一个简易的消息队列应该怎么做。19.不用stream流呢,可以用redis里哪个数据类型20.刚刚说到list,说说redis具体有哪五个基本数据类型21.那么说说zset的原理22.讲讲消息队列的用途23.消息队列kafka和rocketmq有什么区别,适用场景有什么不同。24.linux怎么查看进程25.linux怎么杀死进程26.怎么排查linux硬件问题,查看cpu占用,内存占用等。(没答上)27.linux一个文件里怎么快速查看到指定字段,比如java字段(没答上)28.linux怎么查看最近的10条mysql日志记录(没答上)29.说说linux项目部署流程。(没答上)手撕:有序数组二分查找(可能linux太多没答上有点绷不住了,说找个简单的给我做,结果测试用例写了很久)(我)反问业务(我)声明可实习时长和到岗时间30.对小米的看法怎么样1.3通知一面通过了,等待二面
点赞 评论 收藏
分享
牛客网
牛客企业服务