网易杭研院 大数据开发一,二面(hr面挂)
一面 主要针对简历和项目提问 面试官提前说了会中途打断我的说话
1.数据源哪来的
2.整个环境怎么搭的
3.有多少张表 数据量是多少
4.hive sql执行过程(包括yarn+MapReduce的执行)
5.表的定义信息存在哪的(这里只答出来在metstore 不知道具体)
6.hdfs的存储结构
7.spark项目中怎么用的
8.spark和MapReduce的区别 打断问shuffle的区别 为什么要排序(再次打断) 这里没答好
9.spark的版本
10.hive调参经验 预聚合是什么意思(打断)所有的sql都能预聚合么?
11.spring ioc aop
12.反射的实现方式
13.类加载过程
14.垃圾回收算法 可达性分析算法
15.计算机是如何识别java语句的
16.索引了解么?
整体就是先问一个问题 你答到一半就会打断你 接着问
二面:
基本还是从项目入手 感觉比第一次面试还简单?
1.介绍一个你的项目
2.项目的过程 结果?
3.有哪些事实表?数据源哪来的?
4.三范式?
5.索引失效
6.数据库存储引擎?
7.数据倾斜
8.为什么要转软件
9.再介绍下你的第一个项目
10.喜欢什么样的方向?(答:不接受纯写sql,面试官笑了)
面到一半就开始聊天了,许愿三面
----------------------------------------------
忘了更新了 hr面挂了