以下三十多道八股,包括但不限于:请做一下自我介绍。结合您的项目经理经历,讲一下您对数据仓库的理解。描述数据仓库的四大特点。询问您是否有涉及实时数据仓库。介绍HDFS的副本机制。介绍HDFS的编码机制。介绍HDFS的高可用机制。介绍元数据表的存储方式及其表结构。介绍用户定义函数(UDF)、UDTF及聚合函数。介绍窗口函数及其使用场景。介绍Hadoop生态中常用的数据存储格式。介绍Hadoop生态系统中的资源调度器,包括FIFO、Capacity Scheduler和Fair Scheduler。介绍Kafka分区副本的特点以及如何保证消息不重复消费。询问您对Spark和Flink的了解程度。介绍...