阿里大数据开发电话一面(凉经)
2020年8月31号 电话面 (1h)
刚面试完,赶紧把凉经分享给大家,想冲阿里的兄弟姐妹们加油啊。
首先讲一下阿里面试体验很好,面试官很礼貌很温柔,自己昨天熬夜今天脑子短路,两题SQL题目审题全申错,活该,气自己
1. 编程题(SQL)(30min)给的邮箱链接
1.1 已知有商家销量表 dws_ae_slr_1d, 请仅用一条SQL查询出每个行业的销量最高的Top 20商家,并给出按销售额从高到低给出综合排序(需展示出序号)。如果不行,可给出多条SQL版本。
商家名称(store) 行业(cate) 销量(sell_cnt) 销售额(gmv)
A1 女装 20 300
A2 女装 10 500
B1 男装 15 400
C1 鞋类 40 850
商家名称(store) 行业(cate) 销量(sell_cnt) 销售额(gmv)
A1 女装 20 300
A2 女装 10 500
B1 男装 15 400
C1 鞋类 40 850
1.2 已知有订单销量表 dwd_ae_trd_all_df, 商品表 dim_ae_itm,请仅用一条SQL查询出在售种类(在售种类=商品类型去重计数)最多和最少(如果最多或最少有多个,随机取1个)的商家,并计算出这两个商家的每日GMV(GMV=订单金额求和)。如果不行,可给出多条SQL版本。
订单销量表 dwd_ae_trd_all_df
商家名称(store) 订单ID(order_id) 订单金额(amount) 订单日期(order_time)
A1 A-43213355 20 2020-07-01 12:30:14
A2 A-43423545 15 2020-07-02 10:10:31
A2 A-413131325 10 2020-06-15 15:13:11
商品表 dim_ae_itm
商家名称(store) 商品名称(name) 商品类型(itm_cate)
A1 air01 运动鞋
A1 air02 休闲鞋
A2 book01 小说书
A2 book02 财经类
订单销量表 dwd_ae_trd_all_df
商家名称(store) 订单ID(order_id) 订单金额(amount) 订单日期(order_time)
A1 A-43213355 20 2020-07-01 12:30:14
A2 A-43423545 15 2020-07-02 10:10:31
A2 A-413131325 10 2020-06-15 15:13:11
商品表 dim_ae_itm
商家名称(store) 商品名称(name) 商品类型(itm_cate)
A1 air01 运动鞋
A1 air02 休闲鞋
A2 book01 小说书
A2 book02 财经类
个人感觉难度中等,但是没写对
2. 问答环节(30min)
1. 讲一下Java ==和equals的区别
2.继续上一个问题,如果我重写equals还要重写什么方法
3. 继续上一个问题,我回答的是重写hashcode。那为什么要重写hashcode呢?
4. 如果hash冲突了,怎么解决(我居然只答了两个,另外两个硬是想不起来,真想扇自己两巴掌)
5. 死锁是什么?
6. 死锁的四个必要条件(只回答上来两个,无力吐槽自己了)
7. Java的双亲委派机制讲一下。
8. Hadoop的block大小调大了会造成什么影响?调大好还是调小好一点?为什么?
9. 继续上一个问题,如果对于mr程序,调大好还是调小好?为什么?
10. hive的倾斜的原因?如何解决?
11.继续上一个问题,我首先回答的是参数调优,然后问我哪个参数?
12. 继续上一个问题,那如果不用这个参数那么在map端和reduce端应该做什么?(这一块我被问懵了,我不知道从哪些地方回答了)
13. Hadoop常见的压缩算法有哪些?我回答了snappy,然后问我其他的呢?我说我不记得了!
最后问我有什么想问的,然后我问他给我建议。面试官说我感觉你基础一般,然后给我介绍了他这个部门现在做的事,巴拉巴拉的一堆。
3.总结
这次电话面的给我的感觉是阿里问的问题都是老生常谈的,但是他会在这个方面一直问下去,如果你够强他会继续深挖;如果你不行,他就不会再问了。hive数据倾斜那个问题,如果按照网上给出的答案是绝对不能达到阿里面试官的要求的,希望自己还是多看官方文档,多了解hive以及mr的执行机制才能多方面回答这个问题。
正如面试官所说,本人基础的确一般,广度和深度都不够,挺感谢阿里巴巴给了这次电话面的机会,谢谢!
#面经##阿里巴巴##大数据开发工程师##校招#