58同城大数据开发岗一面面经 (已凉)
58同城一面 2020.09.16(35分种)
面我的这个面试官是上海安居客大数据开发部的,面试官斯斯文文的,不会的他会主动引导,面试体验很好。
1. 自我介绍
2. 你平常开发hive SQL写得多还是spark程序写得多?(我答的spark写得多)
3. 接下来面试官就开始问我hive(就不问你擅长的,哈哈哈哈)。Hive SQL怎么转为mr程序的?(应该是想问语法树那块的内容,这个问题我个人认为问的很好,不过很可惜我没有准备相关知识,只能说不会)
4. 那这个过程既然不懂,那讲一下转为mr之后的流程(MR的执行流程,最好把资源申请阶段带上)
5. hive的join的几种方式(这个我当时懵了,然后面试官很好的引导我说有shuffle join和map join)?然后问我map join怎么实现的?它应用于哪些场景呢?我答的是大表小表join时将小表广播出去。然后继续问那hive怎么做这个广播的呢?
6. 数据仓库模型理解么?分层?
7. 你刚才讲的宽表说它在DWS(数据服务层或者叫数据聚集层)层,那宽表可以细粒度化么?我回答可以,然后继续问那如果细粒度化你觉得宽表应该放在哪层?我回答的是DWD(数据明细层),然后问理由是什么?
8. 问了笔试题目里面的一题,not in那条SQL查询语句的结果。正确答案是5条,面试官问我好多人都选了7条,我想知道你当时做的时候你问什么会想到选5条呢?
9. 平时这些知识都是从哪学来的?看过什么书?
10. 反问环节。
总结