Hive专项练习 6

  1. 删除外部表
  • 先转为内部表 ALTER table1 TBLPROPERTIES('EXTERNAL'='FALSE');
  • 再执行 DROP TABLE table1;
  1. Hive UDF函数
  • 有两个不同的接口编写UDF:UDF和GenericUDF -org.apache.hadoop.hive.ql.exec.UDF 支持Hadoop和Hive的基本类型,如Text、IntWritable、LongWritable、DoubleWritable等
  • org.apache.hadoop.hive.ql.udf.generic.GenericUDF 复杂的GenericUDF可以处理Map、List、Set类型
  1. 0.13版本以前的 Hive SQL
  • Hive SQL IN 不能跟子查询,可以改为类似SQL;
    • SELECT a.key, a.value FROM a OUTER JOIN b ON (a.key=b.key) WHERE B.key <> NULL;
    • SELECT a.key, a.value FROM a LEFT SEMI JOIN b ON (a.key=b.key);
  • 0.13版本以后可使用 EXISTS
  • SELECT a.key, a.value FROM a WHERE a.key EXISTS (SELECT b.key FROM b);
  1. Hive 去重
  • distinct
  • group by
  • row_number() over(partition by order by ) as rn rn = 1
Hive专项练习 文章被收录于专栏

Hive专项练习错题

全部评论

相关推荐

评论
点赞
收藏
分享
牛客网
牛客企业服务