牛客图书馆 > 读书笔记
  • Spark学习之路 (十)SparkCore的调优之Shuffle调优

    一、概述大多数Spark作业的性能主要就是消耗在了shuffle环节,因为该环节包含了大量的磁盘IO、序列化、网络数据传输等操作。因此,如果要让作业的性能更上一层楼,就有必要对shuffle过程进行调优。但是也必须提醒大家的是,影响一个Spark作业性能的因素...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:28:18
  • Spark学习之路 (十一)SparkCore的调优之Spark内存模型

    一、概述Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,引出读者对这...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:37:52
  • Spark学习之路 (十二)SparkCore的调优之资源调优

    一、概述在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:41:34
  • java 并发编程

    并发编程的优缺点 为什么要使用并发编程(并发编程的优点) 充分利用多核CPU的计算能力:通过并发编程的形式可以将多核CPU的计算能力发挥到极致,性能得到提升 方便进行业务拆分,提升系统并发能力和性能:在特殊的...
    牛客大数据入门菜鸡 编辑于 2020-12-30 18:30:13
  • JVM原理

    什么是JVM JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、...
    牛客大数据入门菜鸡 编辑于 2020-12-30 20:01:30
  • Spark学习之路 (十三)SparkCore的调优之资源调优JVM的基本架构

    一、JVM的结构图1.1 Java内存结构 JVM内存结构主要有三大块:堆内存、方法区和栈。 堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:46:08
  • 计算机网络

    计算机网络体系结构 在计算机网络的基本概念中,分层次的体系结构是最基本的。计算机网络体系结构的抽象概念较多,在学习时要多思考。这些概念对后面的学习很有帮助。 网络协议是什么? 在计算机网络要做到有条不紊地交换数据,就必须遵守一些事先约定好的规...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:20:58
  • Spark学习之路 (十四)SparkCore的调优之资源调优JVM的GC垃圾收集器

    一、概述垃圾收集 Garbage Collection 通常被称为“GC”,它诞生于1960年 MIT 的 Lisp 语言,经过半个多世纪,目前已经十分成熟了。 jvm 中,程序计数器、虚拟机栈、本地方法栈都是随线程而生随线程而灭,栈帧随着方法的进入和退出做入...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:54:19
  • JAVA异常

    Java异常架构与异常关键字 Java异常简介 Java异常是Java提供的一种识别及响应错误的一致性机制。 Java异常机制可以使程序中异常处理代码和正常业务代码分离,保证程序代码更加优雅,并提高程序健壮性。在有效使用异常的情况下,异常能清晰的回...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:45:07
  • Spark学习之路 (十五)SparkCore的源码解读(一)启动脚本

    一、启动脚本分析独立部署模式下,主要由master和slaves组成,master可以利用zk实现高可用性,其driver,work,app等信息可以持久化到zk上;slaves由一台至多台主机构成。Driver通过向Master申请资源获取运行环境。 启动m...
    牛客大数据入门菜鸡 编辑于 2020-11-27 17:03:34