数仓工程师 面试题


求思路?
全部评论
set hive.auto.convert.join=true; set hive.mapjoin.smalltable.filesize=300000000; set hive.auto.convert.join.noconditionaltask=true; set hive.auto.convert.join.noconditionaltask.size=300000000; INSERT INTO TABLE ArticleFeatures PARTITION(dt='${etl_dt}') SELECT articleid AS articleid               ,concat_ws(',',collect_set(t2.url_feature)) AS url_features FROM (SELECT DISTINCT                             articled AS articled                             ,image_urls AS image_url              FROM Articles              LATERAW VIEW explode(splite(image_urls,',')) ) t1              LEFT JOIN (SELECT url                                    ,concat_ws(':',url,feature) as url_feature                                  FROM ImageFeatures) t2              ON t1.image_url = t2.url group by articleid 直接手写的没跑过,肯定有问题(PS:我基本每条sql都要测试几遍,很少会有一边通过的样子不知道你们是不是一样),但是思路基本都是一样的,就是行转列再拼起来。关键是这个调优怎么做,很想知道一下大神的思路 个人调优思路:1、提前去重,减少数据量。数据本身较少,直接使用distinct                           2、在设置中开启mapjoin,把小表直接加载进内存中join 感觉除此之外没啥要优化的了
点赞 回复 分享
发布于 2020-02-08 18:17
我感觉就是考察hive的行转列,列转行。。不知道对不对 INSERT OVERWRITE table dbname.ArticleFeatures PARTITION(dt='{hivevar:job_date}') SELECT articleid,concat_ws(",",collect_set(A3.url_features)) FROM ( SELECT     articleid,concat(A1.url,":",A2.feature) AS url_features FROM     (     select      articleid,url      from dbname.Articles      LATERAL VIEW explode(split(image_urls,",")) tabletest AS url     )A1     LEFT JOIN     dbname.ImageFeatures A2     ON A1.url=A2.url )A3 GROUP BY A3.articleid
点赞 回复 分享
发布于 2019-03-01 14:33
您好,想问一下数仓工程师一般笔试会出什么类型的题目?是建模之类的吗?会出变成题目吗?(没参加过笔试想咨询一下)谢谢您
点赞 回复 分享
发布于 2019-03-01 11:16

相关推荐

评论
1
9
分享

创作者周榜

更多
正在热议
更多
# AI面会问哪些问题? #
24732次浏览 486人参与
# 中国电信笔试 #
31057次浏览 283人参与
# 米连集团26产品管培生项目 #
12945次浏览 285人参与
# 你的实习产出是真实的还是包装的? #
18763次浏览 330人参与
# 如果秋招能重来,我会____ #
96686次浏览 500人参与
# 春招至今,你的战绩如何? #
59824次浏览 542人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
14119次浏览 209人参与
# i人适合做什么工作 #
36905次浏览 124人参与
# 我是面试官,请用一句话让我破防 #
79508次浏览 219人参与
# 哪些公司真双非友好? #
69191次浏览 287人参与
# 找AI工作可以去哪些公司? #
7652次浏览 183人参与
# 从事AI岗需要掌握哪些技术栈? #
7630次浏览 244人参与
# 面试尴尬现场 #
220747次浏览 861人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
339882次浏览 2165人参与
# 五一之后,实习真的很难找吗? #
102796次浏览 584人参与
# 金三银四,你的春招进行到哪个阶段了? #
21544次浏览 277人参与
# 你做过最难的笔试是哪家公司 #
29991次浏览 187人参与
# 你小时候最想从事什么职业 #
159835次浏览 2072人参与
# 阿里笔试 #
176326次浏览 1302人参与
# 应届生第一份工资要多少合适 #
20476次浏览 84人参与
# 一张图晒出你司的标语 #
3805次浏览 72人参与
# 面试被问期望薪资时该如何回答 #
382455次浏览 2163人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务