Hive专项练习 6
- 删除外部表
- 先转为内部表 ALTER table1 TBLPROPERTIES('EXTERNAL'='FALSE');
- 再执行 DROP TABLE table1;
- Hive UDF函数
- 有两个不同的接口编写UDF:UDF和GenericUDF -org.apache.hadoop.hive.ql.exec.UDF 支持Hadoop和Hive的基本类型,如Text、IntWritable、LongWritable、DoubleWritable等
- org.apache.hadoop.hive.ql.udf.generic.GenericUDF 复杂的GenericUDF可以处理Map、List、Set类型
- 0.13版本以前的 Hive SQL
- Hive SQL IN 不能跟子查询,可以改为类似SQL;
- SELECT a.key, a.value FROM a OUTER JOIN b ON (a.key=b.key) WHERE B.key <> NULL;
- SELECT a.key, a.value FROM a LEFT SEMI JOIN b ON (a.key=b.key);
- 0.13版本以后可使用 EXISTS
- SELECT a.key, a.value FROM a WHERE a.key EXISTS (SELECT b.key FROM b);
- Hive 去重
- distinct
- group by
- row_number() over(partition by order by ) as rn rn = 1
Hive专项练习 文章被收录于专栏
Hive专项练习错题