滴滴大数据面试题汇总(持续更新)

  1. Spark Streaming面试题

    • 什么是Spark Streaming?它与Spark有什么不同?
    • Spark Streaming如何处理离线数据?
    • 什么是DStream(离散数据流)?如何创建一个DStream?
    • 什么是RDD(弹性分布式数据集)?
    • 如何将已有的RDD转换为DStream?
    • 过滤器转换器(Filter Transformers)是什么?在Spark Streaming中有哪些可用的过滤器转换器?
    • 什么是窗口操作?如何使用它们?
    • 什么是输出操作?在Spark Streaming中有哪些可用的输出操作?
    • 你在处理数据时遇到了内存问题,你该如何处理?
    • 在处理数据时,你发现处理速度很慢,你该如何优化它?
    • Spark Streaming在哪些行业中得到广泛应用?
    • 什么是数据重复?Spark Streaming如何处理重复数据?
    • 什么是延迟(Latency)?如何减少延迟?
    • Spark Streaming与Kafka的集成是如何实现的?
    • Spark Streaming可以如何处理实时大数据处理的问题?
    • 什么是数据突发(Data Spikes)?如何处理突发的数据流?
    • 什么是容错性(Fault Tolerance)?Spark Streaming如何保证容错性?
    • 什么是累加器(Accumulators)?在Spark Streaming中有哪些可用的累加器?
    • 批处理和实时处理有什么区别?Spark Streaming是批处理还是实时处理?
    • 什么是Spark应用程序?如何使用Spark应用程序?
  2. 滴滴数据开发面试题

    • 4道SQL题,主要是关于实际业务问题,涉及多个表的子查询和一些函数。
    • join中条件写on和where里面的区别。
    • MapReduce过程中的溢写过程是什么样?
    • 数据倾斜是什么?容易发生在Map段的哪个部分,应该怎么处理数据倾斜的问题?
    • 会不会Spark,Spark和MapReduce的区别,为什么Spark比MapReduce快?
  3. 滴滴校招面试真题

    • 给定一个整数数组,求该数组中任意两个不同元素之间的最大差值。
  4. 滴滴核心数仓面试题

    • SLA破线怎么预防和感知?

**********************

#大数据面试题##滴滴#
全部评论

相关推荐

不愿透露姓名的神秘牛友
昨天 01:57
滴滴 后端开发 21K x 15薪 本科双一流
点赞 评论 收藏
分享
评论
点赞
1
分享
牛客网
牛客企业服务