牛客图书馆 > 读书笔记
  • Flink 源码阅读笔记(7)- 内存管理

    基于 JVM 的大数据处理分析引擎面临的一个问题是,为了高效地处理数据,有大量的数据需要保存在内存中。直接使用 JVM 堆内存来管理这些数据对象是最简单的实现,但是这样会导致一系列问题:首先,在有大量的数据对象不停地创建和失效的情况下,要正常地管理和控制堆内存...
    牛客大数据入门菜鸡 编辑于 2020-12-03 14:34:05
  • Flink 源码阅读笔记(21)- Flink JobManager HA 机制的扩展与实现

    在 Flink 1.12 中,Flink on Kubernetes 的 Native 部署方案由实验特性正式变更为生产环境可用。其中一个重要特性是扩展了 HA 的实现,引入了一种新的、完全基于 Kubernetes 的 HA 方案。在此之前,Flink on...
    牛客大数据入门菜鸡 编辑于 2021-03-31 13:59:56
  • Flink 源码阅读笔记(11)- Checkpoint 机制和状态恢复

    在上一篇文章中,我们对 Flink 状态管理相关的代码逻辑进行了分析,但为了实现任务的故障恢复以及数据一致性的效果,还需要借助于检查点(Checkpoint)机制。 简单地说,Checkpoint 是一种分布式快照:在某一时刻,对一个 Flink 作业所有的 ...
    牛客大数据入门菜鸡 编辑于 2020-12-09 15:36:04
  • Flink 源码阅读笔记(1)- StreamGraph 的生成

    在编写 Flink 的程序的时候,核心的要点是构造出数据处理的拓扑结构,即任务执行逻辑的 DAG。我们先来看一下 Flink 任务的拓扑在逻辑上是怎么保存的。 StreamExecutionEnvironmentStreamExecutionEnvironme...
    牛客大数据入门菜鸡 编辑于 2020-11-25 15:52:47
  • Flink 源码阅读笔记(6)- 计算资源管理

    在 Flink 中,计算资源的是以 Slot 作为基本单位进行分配的。本文将对 Flink 中计算资源的管理机制加以分析。 Task Slot 的基本概念我们在前面的文章中了解了 Flink 集群的启动流程。在 Flink 集群中,每个 TaskManager...
    牛客大数据入门菜鸡 编辑于 2020-12-02 16:17:11
  • Flink 源码阅读笔记(13)- 双流操作的实现

    在使用 Flink 进行实时数据处理时,一个常用的场景是对两个流的数据进行关联。这篇文章中我们将对双流操作的底层实现机制进行分析。 Window Join and CoGroup Window Join 操作,顾名思义,是基于时间窗口对两个流进行...
    牛客大数据入门菜鸡 编辑于 2020-12-15 14:56:36
  • Java分布式

    分布式理论 问:分布式有哪些理论? CAP 、BASE。分布式 CAP 理论,任何一个分布式系统都无法同时满足 Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性) 这三...
    牛客大数据入门菜鸡 编辑于 2020-12-27 18:23:31
  • Flink 源码阅读笔记(3)- ExecutionGraph 的生成

    我们前面已经分析过 StreamGraph, JobGraph 的生成过程,这两个执行图都是在 client 端生成的。接下来我们将把目光头投向 Flink Job 运行时调度层核心的执行图 - ExecutionGraph。 和 StreamGraph 以及...
    牛客大数据入门菜鸡 编辑于 2020-11-27 15:47:34
  • Flink 源码阅读笔记(4)- RPC

    作为一个分布式系统,Flink 内部不同组件之间通信依赖于 RPC 机制。这篇文章将对 Flink 的 RPC 框架加以分析。 例子先来看一个简单的例子,了解 Flink 内部的 RPC 框架是如何使用的。 public class RpcTest { ...
    牛客大数据入门菜鸡 编辑于 2020-11-30 15:00:39
  • Spark学习之路 (九)SparkCore的调优之数据倾斜调优

    数据倾斜调优调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。 数据倾斜发生时的现象绝大多数task执行...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:21:20