1、京东一面(09.27) 1、自我介绍 2、讲一下对Spark 的了解,Spark 程序执行的流程 3、Spark 的运行模式中有哪几种,yarn-client 跟 yarn-cluster 的区别。 4、讲一下Kafka 跟SparkStreaming,如何保存偏移量 5、消费Kafka 有哪几种模式(至少消费一次,至多消费一次???) 6、应用场景:如果SparkStreaming 读取kafka 的数据,处理数据后分别存储到不同的数据库中,其中一个数据库存储失败,该如何解决? 7、讲一下Spark 的 checkpoint 操作 8、讲一...