卓望数码 笔试
1. 描述HDFS的写流程
2. 给定一个数据集list,利用Spark从hdfs url路径读取数据集,请提供关键代码,用Java/Scala/Python API
3. Flink和Spark Streaming有哪些区别?
4. Hive SQL题。
存在一张表
id quarter sum
1 Q1 200
1 Q2 300
1 Q3 400
1 Q4 500
2 Q1 250
请将列处理成一行的结果。
id Q1_quarter Q2_quarter Q3_quarter Q4_quarter
1 200 300 400 500
2 250 null null null
2. 给定一个数据集list,利用Spark从hdfs url路径读取数据集,请提供关键代码,用Java/Scala/Python API
3. Flink和Spark Streaming有哪些区别?
4. Hive SQL题。
存在一张表
id quarter sum
1 Q1 200
1 Q2 300
1 Q3 400
1 Q4 500
2 Q1 250
请将列处理成一行的结果。
id Q1_quarter Q2_quarter Q3_quarter Q4_quarter
1 200 300 400 500
2 250 null null null
全部评论
相关推荐
点赞 评论 收藏
分享