Hive专项练习 6

  1. 删除外部表
  • 先转为内部表 ALTER table1 TBLPROPERTIES('EXTERNAL'='FALSE');
  • 再执行 DROP TABLE table1;
  1. Hive UDF函数
  • 有两个不同的接口编写UDF:UDF和GenericUDF -org.apache.hadoop.hive.ql.exec.UDF 支持Hadoop和Hive的基本类型,如Text、IntWritable、LongWritable、DoubleWritable等
  • org.apache.hadoop.hive.ql.udf.generic.GenericUDF 复杂的GenericUDF可以处理Map、List、Set类型
  1. 0.13版本以前的 Hive SQL
  • Hive SQL IN 不能跟子查询,可以改为类似SQL;
    • SELECT a.key, a.value FROM a OUTER JOIN b ON (a.key=b.key) WHERE B.key <> NULL;
    • SELECT a.key, a.value FROM a LEFT SEMI JOIN b ON (a.key=b.key);
  • 0.13版本以后可使用 EXISTS
  • SELECT a.key, a.value FROM a WHERE a.key EXISTS (SELECT b.key FROM b);
  1. Hive 去重
  • distinct
  • group by
  • row_number() over(partition by order by ) as rn rn = 1
Hive专项练习 文章被收录于专栏

Hive专项练习错题

全部评论

相关推荐

程序员花海:实习太简单了 学历可以的 实习描述应该是先介绍业务 再介绍技术 技术咋推动业务的 做到了啥收益 有没有做实验 实验组和对照组有什么不同 你最后学到了什么 有没有参与处理过线上问题 有没有参与过公司的code review 有没有参与过技术分享 这些都是可以在实习描述中写的 并且实习和项目不一样不会撞车 应该放在最前面 放在教育背景下面 另外项目有点烂大街 可以看下我主页的简历优化案例
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务