福大大架构师每日一题

2020-09-11 20:53 北京动视元科技有限公司_产品中心_研发工程师

关注

2020-09-11：Hive的优化策略有哪些？

福哥答案2020-09-11：

Hive调优及优化的12种方式
1.请慎重使用COUNT(DISTINCT col)。可以考虑使用Group By 或者 ROW_NUMBER() OVER(PARTITION BY col)方式代替COUNT(DISTINCT col)。
2.小文件会造成资源的多度占用以及影响查询效率。在数据源头HDFS中控制小文件产生的个数。
3.请慎重使用SELECT *。在查询数据表时，指定所需的待查字段名，而非使用 * 号。
4.不要在表关联后面加WHERE条件。采用谓词下推的技术，提早进行过滤有可能减少必须在数据库分区之间传递的数据量。
5.处理掉字段中带有空值的数据。
6.设置并行执行任务数。
7.设置合理的Reducer个数。
8.JVM重用。
9.为什么任务执行的时候只有一个reduce？避免使用全局排序，可以使用sort by进行局部排序。使用GROUP BY进行统计，不会进行全局排序。
10.选择使用Tez引擎。
11.选择使用本地模式。
12.选择使用严格模式。

Hive 任务优化策略-整合，持续更新。
1、好的模型设计事半功倍。
2、解决数据倾斜问题。
3、减少 job 数。
4、设置合理的 MapReduce 的 task 数，能有效提升性能。(比如，10w+级别的计算，用 160个 reduce，那是相当的浪费，1 个足够) 。
5、了解数据分布，自己动手解决数据倾斜问题是个不错的选择。这是通用的算法优化，但算法优化有时不能适应特定业务背景，开发人员了解业务，了解数据，可以通过业务逻辑精确有效的解决数据倾斜问题。
6、数据量较大的情况下，慎用 count(distinct)，group by 容易产生倾斜问题。
7、对小文件进行合并，是行之有效的提高调度效率的方法，假如所有的作业设置合理的文件数，对云梯的整体调度效率也会产生积极的正向影响。
8、优化时把握整体，单个作业最优不如整体最优。

福大大架构师每日一题文章被收录于专栏

最新面试题，针对高级开发人员和架构师。内容是后端、大数据和人工智能。

全部评论

推荐最新楼层

11-28 18:05

杭州电子科技大学 Java

经常一起加班也会产生“吊桥效应”

我发现那些和我一起经常加班、通宵赶deadline的小组同事，相比于到点就下班的同事关系来说，我们的团队感会更强，甚至某些人之间还会有些暧昧，而且在离职之后我们之间的关系也会保存的更久一些，就像那种共患难过的战友般的情谊。 但是…这种“共患难”没必要，我宁愿孤独… …

点赞评论收藏

分享

11-28 09:30

哈尔滨理工大学算法工程师

#printf返回值中，换行符\n是一个字符，也会算一个读取结果(3+1)

点赞评论收藏

分享

10-27 21:46

南京航空航天大学 C++

华子流程挂了是不是秋招就再没机会了，感觉投错部门了

自信的小松鼠在评审：为啥挂

点赞评论收藏

分享

11-20 19:59

已编辑

湖南工业大学嵌入式工程师

双非本科嵌入式想找工作还有希望吗

邮小鼠：粤嵌的项目水的要死来我们学校带过课程实习项目名字是车机终端实际上就是写了了个gui 还是老师把代码发给你你改改的那种

点赞评论收藏

分享

11-29 15:59

圣马家沟学院测试工程师

大华技术-软件测试工程师

11.29二面首先评价：凉了面试内容：1.自我介绍2.什么时候接触测试3.有一个嵌入式产品，你要如何对他进行测试，进行什么测试4.有一个能够在不同网络下进行实时监控的摄像头，进行什么测试，实时视频怎么测试5.对于微信的客户测试和权限测试怎么测试，除了性能测试还有什么测试6.像微信，QQ这些APP，如何进行兼容性测试

查看6道真题和解析软件开发笔面经

点赞评论收藏

分享

评论

3

1

全站热榜

正在热议

# 25届秋招总结 #

449263次浏览 4596人参与

# 如何排解工作中的焦虑 #

72279次浏览 1008人参与

# 地方国企笔面经互助 #

8236次浏览 18人参与

# 找工作时遇到的神仙HR #

565095次浏览 3848人参与

# 实习，投递多份简历没人回复怎么办 #

2458104次浏览 34884人参与

# 虾皮求职进展汇总 #

120958次浏览 908人参与

# 同bg的你秋招战况如何？ #

80981次浏览 595人参与

# 比亚迪工作体验 #

45036次浏览 214人参与

# 现在还是0offer，延毕还是备考 #

826202次浏览 6924人参与

# 春招别灰心，我们一人来一句鼓励 #

43994次浏览 552人参与

# 提前批简历挂麻了怎么办 #

150325次浏览 1980人参与

# 校招入职后的感受 #

162773次浏览 1988人参与

# 发工资后，你做的第一件事是什么 #

13391次浏览 63人参与

# 实习必须要去大厂吗？ #

56109次浏览 963人参与

# 查收我的offer竞争力报告 #

37633次浏览 422人参与

# 如果公司给你放一天假，你会怎么度过？ #

4850次浏览 59人参与

# 百度秋招提前批进度 #

87746次浏览 1041人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

12327次浏览 314人参与

# 实习想申请秋招offer，能不能argue薪资 #

39601次浏览 315人参与

# 听劝，这个公司值得去吗 #

330750次浏览 1339人参与

牛客网
牛客企业服务