大数据开发岗 总体偏技术栈底层- 大数据岗位划分有什么了解,以及倾向- 提到MaxCompute和DataWorks,问使用和了解- hive任务提交到yarn流程- hive的Driver解析过程- 场景题:100G的20个gzip+snappy压缩文件,在50VCore+200G内存的集群下,会启动多少个Mapper- 对Java序列化和Hadoop序列化的理解?Java序列化为什么重?- Java八股:Java内存模型、Java垃圾回收算法做题- 一个数组划分m等份,取第j份的值- 数值反转- 拖时间问的:解析带有$符号的json字符串