Hive 专项练习 9

  1. Hive和传统数据库相比
  • 有类似的查询语言,还是类似的执行器、解释器、计划器
  • 并非所有的Hive数据都存储在HDFS上,有部分元数据存储在MySQL上
  • Hive针对数据仓库设计,针对的是读多写少的场景
  1. Hive数据倾斜
  • 某个reducer的数据输入量远远大于其他reducer数据的输入量
  • key在reducer上分布不均匀
  1. Hive join 支持非等值连接
SELECT a.* FROM a LEFT OUTER JOIN b ON (a.id <> b.id)
  • 需要注意的是,虽然Hive支持非等值连接,但使用非等值连接可能会导致查询的性能不如等值连接
  • 非等值连接可能无法有效利用Hive中的map-side join和bucket map join等优化
  1. Hive 数据删除和修改
  • 虽然Hive支持UPDATE和DELETE操作,但这些操作在Hive中通常效率不高,因为Hive是为批量处理和读密集型工作负载设计的,而不是为事务性工作负载设计的。
  • Hive修改操作通常涉及以下步骤:
    • 读取整个表或分区
    • 应用更改
    • 将结果写入新的表或分区
    • 删除旧的表或分区
Hive专项练习 文章被收录于专栏

Hive专项练习错题

全部评论

相关推荐

11-28 17:48
中山大学 C++
点赞 评论 收藏
分享
10-09 00:50
已编辑
长江大学 算法工程师
不期而遇的夏天:1.同学你面试评价不错,概率很大,请耐心等待;2.你的排名比较靠前,不要担心,耐心等待;3.问题不大,正在审批,不要着急签其他公司,等等我们!4.预计9月中下旬,安心过节;5.下周会有结果,请耐心等待下;6.可能国庆节前后,一有结果我马上通知你;7.预计10月中旬,再坚持一下;8.正在走流程,就这两天了;9.同学,结果我也不知道,你如果查到了也告诉我一声;10.同学你出线不明朗,建议签其他公司保底!11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享
评论
点赞
收藏
分享
牛客网
牛客企业服务