极光一面(2021-09-26大数据开发)
0.单例模式(我项目中用到过)
1.sql去重的方式有几种
2.开窗函数使用过吗?原理是什么,什么情况下使用开窗函数
3.求连续三天登录的用户数:描述一下
4.Leetcode第一题两数之和
5.hashmap的时间时间复杂度
6.spark:sparkstreaming如何对接Kafka将数据存到RDD里面(spark和Kafka对接方式有几种)
7.Kafka的topic里面分区的概念,分区里面有leader和follower的概念,Kafka的分区概念
8.MR的reduce阶段生成的文件数是由什么决定的,分区是由什么决定的,map阶段的分区和reduce阶段的分区
9.MR的整个流程,shuffle具体说一下。
10.反问
#三雄极光##面试题目#