Hive专项练习 2
- Hive数据加载
- load data 方式
不走MapReduce,保证效率前提下最好使用LOAD DATA装载数据。
- insert into 方式
走 MapReduce 速度较慢;但 select语句 使得数据加载灵活。
2. Hive没有索引
- 在加载数据的过程中不会对数据进行任何处理;
- Hive会根据特定条件扫描符合条件的所有数据。
3. Hive函数
- count() 函数必须搭配group by使用,不需要开窗也可以;
- 所有的聚合函数都能用作窗口函数,如MAX MIN 即使聚合函数也是窗口函数。
Hive专项练习 文章被收录于专栏
Hive专项练习错题