人保科技(上海)—数据开发暑期实习
楼主是5月初投递人保科技线下校园招聘,没有笔试,5月30面试,面试结束就oc。
面试问题:
1、2分钟自我结束;
2、hdfs三级备份(好像是这个问题);
3、聊下离线数仓项目;
4、数仓分层:各层存储的区别,细说;
维度建模、关系建模最大区别;
Hive:在哪存储数据;
hive优化:join方向:内连接外连接
维度退化(不了解)
分区和分桶的区别;
内部表和外部表;
5、spark:
使用过spark那些技术:spark sql、spark streaming、structured streaming,大致介绍下
使用这些技术做什么的:我做过的一个实时计算项目
大概就这么多,主要围绕项目考察一些知识,可惜我准备的那么多八股文。。