发表于2024-11-24
深入理解Spark核心思想与源码分析 pdf epub mobi txt 电子书 下载
前言
准 备 篇
dy 章 环境准备2
1.1 运行环境准备2
1.1.1 安装JDK3
1.1.2 安装Scala3
1.1.3 安装Spark4
1.2 Spark初体验4
1.2.1 运行spark-shell4
1.2.2 执行word count5
1.2.3 剖析spark-shell7
1.3 阅读环境准备11
1.4 Spark源码编译与调试13
1.5 小结17
第2章 Spark设计理念与基本架构18
2.1 初识Spark18
2.1.1 Hadoop MRv1的局限18
2.1.2 Spark使用场景20
2.1.3 Spark的特点20
2.2 Spark基础知识20
2.3 Spark基本设计思想22
2.3.1 Spark模块设计22
2.3.2 Spark模型设计24
2.4 Spark基本架构25
2.5 小结26
核心设计篇
第3章 SparkContext的初始化28
3.1 SparkContext概述28
3.2 创建执行环境SparkEnv30
3.2.1 安全管理器SecurityManager31
3.2.2 基于Akka的分布式消息系统ActorSystem31
3.2.3 map任务输出跟踪器mapOutputTracker32
3.2.4 实例化ShuffleManager34
3.2.5 shuffle线程内存管理器ShuffleMemoryManager34
3.2.6 块传输服务BlockTransferService35
3.2.7 BlockManagerMaster介绍35
3.2.8 创建块管理器BlockManager36
3.2.9 创建广播管理器Broadcast-Manager36
3.2.10 创建缓存管理器CacheManager37
3.2.11 HTTP文件服务器HttpFile-Server37
3.2.12 创建测量系统MetricsSystem39
深入理解Spark核心思想与源码分析 电子书 下载 mobi epub pdf txt
深入理解Spark核心思想与源码分析 pdf epub mobi txt 电子书 下载