美团大数据开发转正实习面经(已OC)
一面面试体验整体很不错,面试官很温柔,也不会故意为难你。
一面(2023.3.21)
- 自我介绍
- 简单介绍项目(研一在国电做的)
- 你认为学习到的技术和实际使用的差距在哪
- 项目中的数据都是哪里来的(集团中各种设备运行的数据)
- 你说你用到了Spark那你介绍一下Spark的组件和整体架构(结合Dirver 和 Executor各自的作用)
- 介绍一下Spark的RDD(分布式弹性数据集、基本的数据抽象、封装了计算逻辑、RDD代码层面包含的东西即RDD的属性、有了RDD的依赖就可以生成DAG图)
- 介绍一下Flink(我讲了事件时间、迟到数据的处理啥的)
- 介绍一下Flink状态(就把分类说一下,顺便讲了检查点机制)
- Flink为什么要做checkpoint(为了保证数据不丢)
- operator sate和keyed sate的区别(这个我答得比较简略,只答出来了:1.一个是一个子任务一个状态,一个是一个key一个状态 2.keyed state只能在keyby之后用)
- Flink的反压有了解吗(分布式阻塞队列)
- SQL题目:每个城市某一天骑手送单量的前十名(开窗就行)
- Flink SQL有学习过么(简单用过,不太熟练,我说看网上说的,这个技术不太成熟,他说其实现在已经很成熟了,哈哈哈)
- 接下来聊一些Java的东西吧
- Java的线程池了解吗(线程池的优点,以及构建线程池的时候那几个参数的意义)
- 在实习里面有用到过线程池吗(没有,只是自己写过几个Demo)
- Java里面的读写锁有了解过么(太久没复习,给忘了,这个答得不是很好,我就答了一下ReentrantLock的底层,也就是AQS啥的)
- JVM内存区域划分(讲了1.8的)
- 这几个区域主要是哪里发生垃圾回收(堆,也有元空间但是很少)
- 本地方法栈会发生垃圾回收吗(我答得不会)
- 垃圾回收的算法你有了解过吗(三种算法,顺便讲了CMS和G1垃圾回收器)
- 平时用过Kafka吗(用过,顺便讲了一下它的作用和架构)
- Kafka的消息是存储在哪里的(存储在磁盘上,顺便讲了一下顺序读写)
- 为什么顺序读写会更快(跟随机写对比一下)
- 讲一下ISR队列(保证可靠性,以及它的流程还有特点啥的)
- 算法题:链表,删除所有重复元素(我快写完的时候,面试官说不用写了,你这种方法是可以做出来的,就先这样吧(我感觉可能是时间有点来不及了))
- 经典反问
大概过了三天约的二面,二面体验很差很差,上来就甩题,感觉就是kpi面一样(可能因为我笔试一道没A出来),前半段一直在用训斥的口吻跟我说话(讲真真的快哭出来了,我一个大老爷们都受不了)
二面(2023.3.27)
- 自我介绍
- 写一个单例模式(整个过程挺让人不舒服的,一直在用训斥的语气说话)
- 面试官口述一道题:两个自然数相加,这两个自然数可能会非常大(就是大数
a + b
),体验也很差,我写完之后,因为没有测试用例(他口述的题目,没法提交验证),我就随便写了两个例子试了一下,他就说:你写这么多行代码,就用这么几个用例测试吗(训斥的口吻),最好还是提示了一下,后面的while循环没有测,反正最后是写出来了 - MySQL用过么,它的索引用什么结构实现的(B+树)
- B+树除了查询稳定,还有其他的优势吗(更适合范围查询)
- B和B+树的核心区别(答了非叶子节点的区别)
- 怎么看一个SQL需要优化的地方
- 场景图:给一道SQL,问怎么建索引,大概是:
select orz,dt,ort from tb where dt >= '2021-10-03' and dt <= '2021-10-25' and/or ort in (4,5,6)
ort的连接条件我记不清是and还是or了。我说建联合索引(dt和rt),他问谁在前谁在后,我说应该是dt吧(因为我真不会,我是感觉这俩前后是无所谓的),希望有大佬可以解答一下 - Java的动态代理(我只记得反射了)(总感觉自己在面后端,不是大数据)
- 聊了一下最新的我在做的项目(给国能做的知识图谱的),聊了挺多的,这个时候气氛才拉回来
- 经典反问
3.29 offer
#我的实习求职记录##实习##大数据面经##美团23春招24实#