1. 描述HDFS的写流程2. 给定一个数据集list,利用Spark从hdfs url路径读取数据集,请提供关键代码,用Java/Scala/Python API3. Flink和Spark Streaming有哪些区别?4. Hive SQL题。存在一张表id quarter sum1 Q1 2001 Q2 3001 Q3 4001 Q4 5002 Q1 250请将列处理成一行的结果。id Q1_quarter Q2_quarter Q3_quarter Q4_quarter1 200 300 400 5002 250 null null null