美团大数据开发转正实习面经(已OC)

一面面试体验整体很不错，面试官很温柔，也不会故意为难你。

一面(2023.3.21)

自我介绍
简单介绍项目(研一在国电做的)
你认为学习到的技术和实际使用的差距在哪
项目中的数据都是哪里来的(集团中各种设备运行的数据)
你说你用到了Spark那你介绍一下Spark的组件和整体架构(结合Dirver 和 Executor各自的作用)
介绍一下Spark的RDD(分布式弹性数据集、基本的数据抽象、封装了计算逻辑、RDD代码层面包含的东西即RDD的属性、有了RDD的依赖就可以生成DAG图)
介绍一下Flink(我讲了事件时间、迟到数据的处理啥的)
介绍一下Flink状态(就把分类说一下，顺便讲了检查点机制)
Flink为什么要做checkpoint(为了保证数据不丢)
operator sate和keyed sate的区别(这个我答得比较简略，只答出来了：1.一个是一个子任务一个状态，一个是一个key一个状态 2.keyed state只能在keyby之后用)
Flink的反压有了解吗(分布式阻塞队列)
SQL题目:每个城市某一天骑手送单量的前十名(开窗就行)
Flink SQL有学习过么(简单用过，不太熟练，我说看网上说的，这个技术不太成熟，他说其实现在已经很成熟了，哈哈哈)
接下来聊一些Java的东西吧
Java的线程池了解吗(线程池的优点，以及构建线程池的时候那几个参数的意义)
在实习里面有用到过线程池吗(没有，只是自己写过几个Demo)
Java里面的读写锁有了解过么(太久没复习，给忘了，这个答得不是很好，我就答了一下ReentrantLock的底层，也就是AQS啥的)
JVM内存区域划分(讲了1.8的)
这几个区域主要是哪里发生垃圾回收(堆，也有元空间但是很少)
本地方法栈会发生垃圾回收吗(我答得不会)
垃圾回收的算法你有了解过吗(三种算法，顺便讲了CMS和G1垃圾回收器)
平时用过Kafka吗(用过，顺便讲了一下它的作用和架构)
Kafka的消息是存储在哪里的(存储在磁盘上，顺便讲了一下顺序读写)
为什么顺序读写会更快(跟随机写对比一下)
讲一下ISR队列(保证可靠性，以及它的流程还有特点啥的)
算法题：链表，删除所有重复元素(我快写完的时候，面试官说不用写了，你这种方法是可以做出来的，就先这样吧(我感觉可能是时间有点来不及了))
经典反问

大概过了三天约的二面，二面体验很差很差，上来就甩题，感觉就是kpi面一样(可能因为我笔试一道没A出来)，前半段一直在用训斥的口吻跟我说话(讲真真的快哭出来了，我一个大老爷们都受不了)

二面（2023.3.27）

自我介绍
写一个单例模式(整个过程挺让人不舒服的，一直在用训斥的语气说话)
面试官口述一道题：两个自然数相加，这两个自然数可能会非常大(就是大数 a + b)，体验也很差，我写完之后，因为没有测试用例(他口述的题目，没法提交验证)，我就随便写了两个例子试了一下，他就说：你写这么多行代码，就用这么几个用例测试吗(训斥的口吻)，最好还是提示了一下，后面的while循环没有测，反正最后是写出来了
MySQL用过么，它的索引用什么结构实现的(B+树)
B+树除了查询稳定，还有其他的优势吗(更适合范围查询)
B和B+树的核心区别(答了非叶子节点的区别)
怎么看一个SQL需要优化的地方
场景图：给一道SQL，问怎么建索引，大概是：select orz,dt,ort from tb where dt >= '2021-10-03' and dt <= '2021-10-25' and/or ort in (4,5,6) ort的连接条件我记不清是and还是or了。我说建联合索引(dt和rt)，他问谁在前谁在后，我说应该是dt吧（因为我真不会，我是感觉这俩前后是无所谓的），希望有大佬可以解答一下
Java的动态代理(我只记得反射了)(总感觉自己在面后端，不是大数据)
聊了一下最新的我在做的项目(给国能做的知识图谱的)，聊了挺多的，这个时候气氛才拉回来
经典反问