卓望数码 笔试

1. 描述HDFS的写流程
2. 给定一个数据集list,利用Spark从hdfs url路径读取数据集,请提供关键代码,用Java/Scala/Python API
3. Flink和Spark Streaming有哪些区别?
4. Hive SQL题。

存在一张表
id quarter sum
1 Q1 200
1 Q2 300
1 Q3 400
1 Q4 500
2 Q1 250

请将列处理成一行的结果。
id Q1_quarter Q2_quarter Q3_quarter Q4_quarter
1    200                300            400                500
2     250                null            null                null
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客企业服务