数仓工程师 面试题


求思路?
全部评论
set hive.auto.convert.join=true; set hive.mapjoin.smalltable.filesize=300000000; set hive.auto.convert.join.noconditionaltask=true; set hive.auto.convert.join.noconditionaltask.size=300000000; INSERT INTO TABLE ArticleFeatures PARTITION(dt='${etl_dt}') SELECT articleid AS articleid               ,concat_ws(',',collect_set(t2.url_feature)) AS url_features FROM (SELECT DISTINCT                             articled AS articled                             ,image_urls AS image_url              FROM Articles              LATERAW VIEW explode(splite(image_urls,',')) ) t1              LEFT JOIN (SELECT url                                    ,concat_ws(':',url,feature) as url_feature                                  FROM ImageFeatures) t2              ON t1.image_url = t2.url group by articleid 直接手写的没跑过,肯定有问题(PS:我基本每条sql都要测试几遍,很少会有一边通过的样子不知道你们是不是一样),但是思路基本都是一样的,就是行转列再拼起来。关键是这个调优怎么做,很想知道一下大神的思路 个人调优思路:1、提前去重,减少数据量。数据本身较少,直接使用distinct                           2、在设置中开启mapjoin,把小表直接加载进内存中join 感觉除此之外没啥要优化的了
点赞 回复 分享
发布于 2020-02-08 18:17
我感觉就是考察hive的行转列,列转行。。不知道对不对 INSERT OVERWRITE table dbname.ArticleFeatures PARTITION(dt='{hivevar:job_date}') SELECT articleid,concat_ws(",",collect_set(A3.url_features)) FROM ( SELECT     articleid,concat(A1.url,":",A2.feature) AS url_features FROM     (     select      articleid,url      from dbname.Articles      LATERAL VIEW explode(split(image_urls,",")) tabletest AS url     )A1     LEFT JOIN     dbname.ImageFeatures A2     ON A1.url=A2.url )A3 GROUP BY A3.articleid
点赞 回复 分享
发布于 2019-03-01 14:33
您好,想问一下数仓工程师一般笔试会出什么类型的题目?是建模之类的吗?会出变成题目吗?(没参加过笔试想咨询一下)谢谢您
点赞 回复 分享
发布于 2019-03-01 11:16

相关推荐

最喜欢秋天的火龙果很...:第一份工作一定要往大的去,工资低点没事。后面换工作会更好找,即使你去小公司,你也不可能不会换工作的。所以找大的去
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
正在热议
更多
# 长得好看会提高面试通过率吗? #
3876次浏览 45人参与
# 离家近房租贵VS离家远但房租低,怎么选 #
16896次浏览 137人参与
# 巨人网络春招 #
11520次浏览 224人参与
# 春招至今,你的战绩如何? #
15630次浏览 144人参与
# 你的实习产出是真实的还是包装的? #
3051次浏览 53人参与
# 沪漂/北漂你觉得哪个更苦? #
1513次浏览 40人参与
# MiniMax求职进展汇总 #
25123次浏览 321人参与
# HR最不可信的一句话是__ #
1078次浏览 32人参与
# AI面会问哪些问题? #
935次浏览 23人参与
# 你做过最难的笔试是哪家公司 #
1228次浏览 22人参与
# AI时代,哪个岗位还有“活路” #
2814次浏览 51人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152901次浏览 889人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
8007次浏览 43人参与
# XX请雇我工作 #
51155次浏览 171人参与
# 简历第一个项目做什么 #
32131次浏览 360人参与
# 简历中的项目经历要怎么写? #
311028次浏览 4264人参与
# 投格力的你,拿到offer了吗? #
178337次浏览 891人参与
# 你最满意的offer薪资是哪家公司? #
76978次浏览 375人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
187585次浏览 1123人参与
# AI时代,哪些岗位最容易被淘汰 #
64704次浏览 883人参与
# 如果重来一次你还会读研吗 #
230010次浏览 2011人参与
# 正在春招的你,也参与了去年秋招吗? #
364336次浏览 2642人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务