牛客图书馆 > 读书笔记
  • Spark学习之路 (十二)SparkCore的调优之资源调优

    一、概述在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:41:34
  • java 并发编程

    并发编程的优缺点 为什么要使用并发编程(并发编程的优点) 充分利用多核CPU的计算能力:通过并发编程的形式可以将多核CPU的计算能力发挥到极致,性能得到提升 方便进行业务拆分,提升系统并发能力和性能:在特殊的...
    牛客大数据入门菜鸡 编辑于 2020-12-30 18:30:13
  • JVM原理

    什么是JVM JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、...
    牛客大数据入门菜鸡 编辑于 2020-12-30 20:01:30
  • Spark学习之路 (十三)SparkCore的调优之资源调优JVM的基本架构

    一、JVM的结构图1.1 Java内存结构 JVM内存结构主要有三大块:堆内存、方法区和栈。 堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:46:08
  • 计算机网络

    计算机网络体系结构 在计算机网络的基本概念中,分层次的体系结构是最基本的。计算机网络体系结构的抽象概念较多,在学习时要多思考。这些概念对后面的学习很有帮助。 网络协议是什么? 在计算机网络要做到有条不紊地交换数据,就必须遵守一些事先约定好的规...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:20:58
  • Spark学习之路 (十四)SparkCore的调优之资源调优JVM的GC垃圾收集器

    一、概述垃圾收集 Garbage Collection 通常被称为“GC”,它诞生于1960年 MIT 的 Lisp 语言,经过半个多世纪,目前已经十分成熟了。 jvm 中,程序计数器、虚拟机栈、本地方法栈都是随线程而生随线程而灭,栈帧随着方法的进入和退出做入...
    牛客大数据入门菜鸡 编辑于 2020-11-27 16:54:19
  • JAVA异常

    Java异常架构与异常关键字 Java异常简介 Java异常是Java提供的一种识别及响应错误的一致性机制。 Java异常机制可以使程序中异常处理代码和正常业务代码分离,保证程序代码更加优雅,并提高程序健壮性。在有效使用异常的情况下,异常能清晰的回...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:45:07
  • Spark学习之路 (十五)SparkCore的源码解读(一)启动脚本

    一、启动脚本分析独立部署模式下,主要由master和slaves组成,master可以利用zk实现高可用性,其driver,work,app等信息可以持久化到zk上;slaves由一台至多台主机构成。Driver通过向Master申请资源获取运行环境。 启动m...
    牛客大数据入门菜鸡 编辑于 2020-11-27 17:03:34
  • Spark学习之路 (十六)SparkCore的源码解读(二)spark-submit提交脚本

    一、概述 上一篇主要是介绍了spark启动的一些脚本,这篇主要分析一下Spark源码中提交任务脚本的处理逻辑,从spark-submit一步步深入进去看看任务提交的整体流程,首先看一下整体的流程概要图: 二、源码解读2.1 spark-submit # -z...
    牛客大数据入门菜鸡 编辑于 2020-11-27 17:07:49
  • Spark学习之路 (十七)Spark分区

    一、分区的概念  分区是RDD内部并行计算的一个计算单元,RDD的数据集在逻辑上被划分为多个分片,每一个分片称为分区,分区的格式决定了并行计算的粒度,而每个分区的数值计算都是在一个任务中进行的,因此任务的个数,也是由RDD(准确来说是作业最后一个RDD)的分区...
    牛客大数据入门菜鸡 编辑于 2020-11-27 18:21:06