0 Shark Spark 的一个组件,用于大规模数据分析的 SQL 查询引擎。Shark 提供了一种基于 SQL 的交互式查询方式,可以让用户轻松地对大规模数据集进行查询和分析。Shark 基于 Hive 项目,使用 Hive 的元数据存储和查询语法,并基于Hive进行了性能优化和扩展。 0.1 设计 灵感来自 Google 的 Dremel 系统: 将数据存储在列式存储引擎 使用分布式计算引擎进行查询 Shark 采用类似架构并使用 Spark 作为计算引擎,使 Shark 具有很高查询性能和可扩展性。 0.2 缺陷 Shark 在 Spark 1.0 发布之后被正式弃用,Shark ...