数仓面试求教
面试数仓岗位问题如下:
1.mapreduce中为何要hash partition分区
2.mapreduce中为何使用快拍和归并排序
3.两张表,译过来就是a为维表(不小),b为事实表,两表关联,如何优化?问后说关联是出现数据倾斜。
数仓只知道mapreduce的原理流程,具体环节没有深究,大佬有能给解答的吗#面试那些事##数据仓库工程师##面试题目#
1.mapreduce中为何要hash partition分区
2.mapreduce中为何使用快拍和归并排序
3.两张表,译过来就是a为维表(不小),b为事实表,两表关联,如何优化?问后说关联是出现数据倾斜。
数仓只知道mapreduce的原理流程,具体环节没有深究,大佬有能给解答的吗#面试那些事##数据仓库工程师##面试题目#