Spark SQL 表分区与分桶详解一、表分区(Partitioning)定义:通过指定业务相关字段(如日期、地域)将数据物理划分为独立目录存储,实现垂直切分。核心特性:目录结构映射:/table/path/partition_column=value/分区裁剪:自动跳过无关分区,减少I/O适用场景:有明显时间范围查询(如WHERE dt='2023-01-01')创建语法: -- 静态分区表 CREATE TABLE logs ( user_id STRING, event STRING ) PARTITIONED BY (dt STRING, country STRING) STO...