一道大数据面试sql题目分享
今天在群里面看到一道面试sql题目,感觉挺有意思的,就过来分享一下。
原题目是这样的。
就是给你一行日期,有个起始日期和结束日期,让你生成多行数据。
日期A和日期B一开始就有的,
那么面试题目就变成了,如何将1行数据变成了B-A+1行,且每行是递增的日期。
如何实现每行递增的日期呢,我们可以使用row_number排序,生成1-n排名,在date_add一下即可。
熟悉hive的第一反应肯定就是炸裂函数explode,或者自定义udtf。如果在面试的时候去手撕一个自定义udtf,那还是挺恐怖的。
利用space函数搭配split生成数组。再搭配explode即可将一行转换成多行。
那么我们就可以求出B - A ,调用split(space(B-A))再结合explode即可生成B-A+1行
下面给出我的代码,仅供参考,这里面我使用了更加方便的 posexplode 炸裂函数,posexplode 炸裂函数可以炸裂出来对应的索引号