校招一面凉经

1、自我介绍(包含学校履历)
2、在大学学到了什么?好像比较看重学校经历。。。
3、Java 后端开发、大数据开发、分布式项目学习
4、你对数据仓库的理解?数据仓库建模方面的?
5、你提到的数据分层,但是有没有考虑为什么要做数据仓库?
6、Hive中排序操作:order by、sort by、distribute by、cluster by之间的区别?
7、实习经验中,用的最多的是哪种排序?对应底层MapReduce的执行过程是怎样的呢?
8、MapReduce 和 Spark区别
9、Spark为啥要比MapReduce快,最核心的原因在哪(为啥会产生Spark)
10、开始介绍Rdd(说说你对Rdd的理解)
11、rdd的容错,是不是意味着每次都需要重新算一次?
12、spark是怎么做阶段拆分?(宽窄依赖)
13、sparkstreaming 怎么和rdd结合,怎么将一个流数据最后转化成通过spark的rdd来处理的?sparkstreaming 核心还是依赖在spark core,核心就是rdd,
sparkstreaming 和 spark core 两大组件是怎么运作的?
14、ss消费kafka 有哪两种模式?有啥区别?
15、了解Flink?说一下Flink的了解?(为什么Flink开始流行,它的应用场景是?)
16、UDF、UDTF、UDAF的区别?Java怎么去写一个UDF、开发、部署、上线应用流程?
17、Java相关知识点:
- SpringBoot的理解?
- Spring的基本概念:IOC(控制反转)、AOP(依赖注入),面向切面编程,是什么?解决了什么问题?它是怎么实现的?
- Spring对象的管理,直接引用其他类的对象?
18、哪些场景使用MySQL、Redis?
19、为什么不直接查MySQL?查询性能考虑外,为什么要加一层Redis?Redis存在缓存滞后的缺点,主要为了达到什么目的来引入Redis。
20、换个角度,高并发下查MySQL、Redis有什么问题?mysql承担这么大并发,mysql会存在崩掉的问题?引入这个技术,到底解决什么问题?
21、Java面向对象理念的理解。
22、了解过设计模式,讲一个最熟悉的模式?
23、Spark 数据倾斜你是怎么解决的?
24、Kafka哪些设计,让它读写性能很快?
25、思考题:2.5亿整数,让你找出不重复的整数。
26、解释一下bitmap、布隆过滤器。
整数10,按照bitmap进行映射,怎么映射的,映射到bitmap的位点?长整数能映射到bitmap中去吗?
---
知识树,经典的论文到底是解决什么问题?论文串起来,到底解决什么问题?
Spark、Flink都可以深入了解下

#2023校招#
全部评论
面试的哪家公司?
1 回复 分享
发布于 2022-07-27 22:55
你这是大数据岗吧,还带一些后端知识
点赞 回复 分享
发布于 2022-07-28 09:53
快冲网易游戏(互娱)2023届校招! 专属内推码:9cREOy 快来加入我们吧!网申链接:https://game.campus.163.com/position
点赞 回复 分享
发布于 2022-07-30 22:39

相关推荐

10-30 22:18
已编辑
毛坦厂中学 C++
点赞 评论 收藏
分享
Hello_WordN:咱就是说,除了生命其他都是小事,希望面试官平安,希望各位平时也多注意安全
点赞 评论 收藏
分享
1 7 评论
分享
牛客网
牛客企业服务