滴滴大数据面试题汇总(持续更新)
-
Spark Streaming面试题:
- 什么是Spark Streaming?它与Spark有什么不同?
- Spark Streaming如何处理离线数据?
- 什么是DStream(离散数据流)?如何创建一个DStream?
- 什么是RDD(弹性分布式数据集)?
- 如何将已有的RDD转换为DStream?
- 过滤器转换器(Filter Transformers)是什么?在Spark Streaming中有哪些可用的过滤器转换器?
- 什么是窗口操作?如何使用它们?
- 什么是输出操作?在Spark Streaming中有哪些可用的输出操作?
- 你在处理数据时遇到了内存问题,你该如何处理?
- 在处理数据时,你发现处理速度很慢,你该如何优化它?
- Spark Streaming在哪些行业中得到广泛应用?
- 什么是数据重复?Spark Streaming如何处理重复数据?
- 什么是延迟(Latency)?如何减少延迟?
- Spark Streaming与Kafka的集成是如何实现的?
- Spark Streaming可以如何处理实时大数据处理的问题?
- 什么是数据突发(Data Spikes)?如何处理突发的数据流?
- 什么是容错性(Fault Tolerance)?Spark Streaming如何保证容错性?
- 什么是累加器(Accumulators)?在Spark Streaming中有哪些可用的累加器?
- 批处理和实时处理有什么区别?Spark Streaming是批处理还是实时处理?
- 什么是Spark应用程序?如何使用Spark应用程序?
-
滴滴数据开发面试题:
- 4道SQL题,主要是关于实际业务问题,涉及多个表的子查询和一些函数。
- join中条件写on和where里面的区别。
- MapReduce过程中的溢写过程是什么样?
- 数据倾斜是什么?容易发生在Map段的哪个部分,应该怎么处理数据倾斜的问题?
- 会不会Spark,Spark和MapReduce的区别,为什么Spark比MapReduce快?
-
滴滴校招面试真题:
- 给定一个整数数组,求该数组中任意两个不同元素之间的最大差值。
-
滴滴核心数仓面试题:
- SLA破线怎么预防和感知?
**********************
#大数据面试题##滴滴#