有赞一、二面凉经(大数据开发工程师)
大数据开发工程师(偏数仓)
一面(50分钟):
1,自我介绍+实习工作
2,简单描述一下MapReduce过程
3,hive数据倾斜是什么,如何处理
4,hive和spark SQL的区别
5,数仓的结构简单描述一下
6,yarn和hbase了解吗,yarn有哪些常用的接口?(很诚实的说了不太了解yarn,hbase有一些了解。于是简单介绍了一些hbase的架构)
7,hbase的文件如何存储?hbase的为什么查询速度快。
8,分享大学或研究生最有成就得一件事(然后就开始问计算机基础知识了)
9,数据库三范式,介绍一下索引
10,TCP/IP体系描述一下,各种协议,TCP和UDP各自的使用场景,TCP三次握手四次挥手
11,dijkstra算法描述一次,B+树描述一下,B树与B+ 树的区别
12, 进程和线程的区别
13, 快排和冒泡的时间空间复杂度
二面(35分钟):
1,自我介绍
2,数据库索引(真的没复习,怪我自己)
3,数据库三范式,举第二范式和第三范式的反面具体例子
4,数仓的常用的模型有哪些,讲一下
5,100万条客户id记录,丢失了,两条,如何把丢失的数据查找出来
6,实习的项目(估计是看我前面的内容回答的不好,不知道该问什么了)
7,你有什么想问的
基本就是这样,一站式面试,打怪升级,无缘见到hr小姐姐了。