内容介绍
G1GC提出了不确定性Region,每个空闲Region不是为某个固定年代准备的,它是灵活的,需求驱动的,所以G1GC代表了XJ性。 《深入理解JVM&G1GC》主要为学习Java语言的学生、初级程序员提供GC的使用参考建议及经验,着重介绍了G1GC。中国的软件开发行业已经有几十年了,从目前的行业发展来看,单纯的软件公司很难有发展,目前流行的云计算、物联网企业实际上是综合性IT技术的整合,这J需要有综合能力的程序员。《深入理解JVM&G1GC》作者力求做到知识的综合传播,而不是仅仅针对Java虚拟机和GC调优进行讲解,也力求每一章节都有实际的案例支撑。《深入理解JVM&G1GC》具体包括以下几方面:JVM基础知识、GC基础知识、G1GC的深入介绍、G1GC调优建议、JDK自带工具使用介绍等。 通读《深入理解JVM&G1GC》后,读者可以深入了解G1GC性能调优的许多主题及相关的综合性知识。读者也可以把《深入理解JVM&G1GC》作为参考,对于感兴趣的主题,直接跳到相应章节寻找答案。
关联推荐
★没有一招鲜似的调优秘籍或包罗万象的性能百科
★GC性能调优需要专门的知识技能才能解决
★解决的GC性能问题越多,技艺才会越精湛
★《深入理解JVM & G1 GC》不仅有技术实践,还有设计原理和目标
★让你深入掌握GC,积累更多技术与经验,
★更好地提升产品性能
目录
目 录 序 VII 前言 IX D1章 JVM & GC基础知识 1 1.1 引言 2 1.2 基本术语 3 1.2.1 Java相关术语 4 1.2.2 JVM/GC通用术语 24 1.2.3 G1涉及术语 56 1.3 本章小结 62 D2章 JVM & GC深入知识 63 2.1 Java虚拟机内存模型 64 2.1.1 程序计数器 65目 录
序 VII
前言 IX
D1章 JVM & GC基础知识 1
1.1 引言 2
1.2 基本术语 3
1.2.1 Java相关术语 4
1.2.2 JVM/GC通用术语 24
1.2.3 G1涉及术语 56
1.3 本章小结 62
D2章 JVM & GC深入知识 63
2.1 Java虚拟机内存模型 64
2.1.1 程序计数器 65
2.1.2 虚拟机栈 66
2.1.3 本地方法栈 72
2.1.4 Java堆 73
2.1.5 方法区 79
2.2 垃圾收集算法 82
2.2.1 引用计数法 82
2.2.2 根搜索算法 83
2.2.3 标记-清除算法(Mark-Sweep) 85
2.2.4 复制算法(Copying) 87
2.2.5 标记-压缩算法(Mark-Compact) 89
2.2.6 增量算法(Incremental Collecting) 90
2.2.7 分代收集算法(Generational Collecting) 91
2.3 Garbage Collection 92
2.3.1 GC概念 92
2.3.2 垃圾收集器分类 93
2.3.3 Serial收集器 94
2.3.4 ParNew收集器 96
2.3.5 Parallel收集器 99
2.3.6 CMS收集器 102
2.3.7 Garbage First(G1)GC 106
2.4 常见问题解析 112
2.4.1 jmap -heap或-histo不能用 112
2.4.2 YGC越来越慢 112
2.4.3 JavaYJ代去哪儿了 114
2.5 本章小结 116
D3章 G1 GC应用示例 117
3.1 范例程序 118
3.2 选项解释及应用 124
3.3 本章小结 166
D4章 深入G1 GC 167
4.1 G1 GC概念简述 168
4.1.1 背景知识 168
4.1.2 G1的垃圾回收机制 169
4.1.3 G1的区间设计灵感 169
4.2 G1 GC分代管理 172
4.2.1 年轻代 172
4.2.2 年轻代回收暂停 173
4.2.3 大对象区间 174
4.2.4 混合回收暂停 176
4.2.5 回收集合及其重要性 178
4.2.6 RSet及其重要性 178
4.2.7 并行标记循环 182
4.2.8 评估失败和WQ回收 186
4.3 G1 GC使用场景 186
4.4 G1 GC论文原文翻译(部分) 187
4.4.1 开题 187
4.4.2 数据结构/机制 188
4.4.3 未来展望 190
4.5 本章小结 191
D5章 G1 GC性能优化方案 192
5.1 G1的年轻代回收 193
5.2 年轻代优化 203
5.3 并行标记阶段优化 205
5.4 混合回收阶段 207
5.4.1 初步介绍 207
5.4.2 深入介绍 208
5.5 如何避免出现GC失败 210
5.6 引用处理 211
5.6.1 观察引用处理 212
5.6.2 引用处理优化 213
5.7 本章小结 214
D6章 JVM诊断工具使用介绍 215
6.1 SA基础介绍 216
6.2 SA工具使用实践 217
6.2.1 如何启动SA 217
6.2.2 SA原理及使用介绍 222
6.3 其他工具介绍 231
6.3.1 GCHisto 231
6.3.2 JConsole 232
6.3.3 VisualVM 236
6.4 本章小结 238 显示全部信息
在线试读
2.2.1 引用计数法 引用计数法(Reference Counting)在GC执行垃圾回收之前,1先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为已经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程我们可以称为垃圾标记阶段。 引用计数器的实现很简单,对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器J加1,D引用失效时,引用计数器J减1。只要对象A的引用计数器的值为0,则对象AJ不可能再被使用。也J是说,引用计数器的实现只需要为每个对象配置一个整形的计数器即可。引用计数器算法的一大优势J是不用等待内存不够用的时候,才进行垃圾的回收,WQ可以在赋值操作的同时检查计数器是否为0,如果是的话J可以立即回收。 但是引用计数器有一个严重的问题,即无法处理循环引用的情况。一个简单的循环引用问题的描述如下:有对象A和对象B,对象A中含有对象B的引用,对象B中含有对象A的引用。此时,对象A和对象B的引用计数器都不为0,但是在系统中却不存在任何D3个对象引用了A或B。也J是说,A和B是应该被回收的垃圾对象,但由于垃圾对象间相互引用,从而使垃圾回收器无法识别,引起内存泄漏。 如图2-6所示,构造了一个列表,将Z后一个元素的next属性指向D一个元素,即引用D一个元素,从而构成循环引用。这个时候如果将列表的头head赋值为null,此时列表的各个元素的计数器都不为0,同时也失去了对列表的引用控制,从而导致列表元素不能被回收。 引用计数器拥有一些特性,1先它需要单D的字段存储计数器,这样的做法增加了存储空间的开销。其次,每次赋值都需要更新计数器,这增加了时间开销。再者,垃圾对象便于辨识,只要计数器为0,J可作为垃圾回收。接下来它能方便及时地回收垃圾,没有延迟性。Z后不能解决循环引用的问题。正是由于Z后一条致命缺陷,导致在Java的垃圾回收器中没有使用这类算法。
2.2.1 引用计数法
引用计数法(Reference Counting)在GC执行垃圾回收之前,1先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为已经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程我们可以称为垃圾标记阶段。
引用计数器的实现很简单,对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器J加1,D引用失效时,引用计数器J减1。只要对象A的引用计数器的值为0,则对象AJ不可能再被使用。也J是说,引用计数器的实现只需要为每个对象配置一个整形的计数器即可。引用计数器算法的一大优势J是不用等待内存不够用的时候,才进行垃圾的回收,WQ可以在赋值操作的同时检查计数器是否为0,如果是的话J可以立即回收。
但是引用计数器有一个严重的问题,即无法处理循环引用的情况。一个简单的循环引用问题的描述如下:有对象A和对象B,对象A中含有对象B的引用,对象B中含有对象A的引用。此时,对象A和对象B的引用计数器都不为0,但是在系统中却不存在任何D3个对象引用了A或B。也J是说,A和B是应该被回收的垃圾对象,但由于垃圾对象间相互引用,从而使垃圾回收器无法识别,引起内存泄漏。
如图2-6所示,构造了一个列表,将Z后一个元素的next属性指向D一个元素,即引用D一个元素,从而构成循环引用。这个时候如果将列表的头head赋值为null,此时列表的各个元素的计数器都不为0,同时也失去了对列表的引用控制,从而导致列表元素不能被回收。
引用计数器拥有一些特性,1先它需要单D的字段存储计数器,这样的做法增加了存储空间的开销。其次,每次赋值都需要更新计数器,这增加了时间开销。再者,垃圾对象便于辨识,只要计数器为0,J可作为垃圾回收。接下来它能方便及时地回收垃圾,没有延迟性。Z后不能解决循环引用的问题。正是由于Z后一条致命缺陷,导致在Java的垃圾回收器中没有使用这类算法。
2.2.2 根搜索算法
HotSpot和大部分JVM都是使用根搜索算法作为垃圾标记的算法实现。前面介绍过的引用计数算法尽管实现简单,执行效率也不错,但是该算法本身却存在一个较大的弊端,甚至会影响到垃圾标记的准确性。由于引用计数算法会为程序中的每一个对象都创建一个私有的引用计数器,D目标对象被其他存活对象引用时,引用计数器中的值则会加1,不再引用时便会减1,D引用计数器中的值为0的时候,J意味着该对象已经不再被任何存活对象引用,可以被标记为垃圾对象。采用这种方式看起来似乎没有任何问题,但是如果一些明显已经死亡了的对象尽管没有被任何的存活对象引用,但是它们彼此之间却存在相互引用时,引用计数器中的值则永远不会为0,这样便会导致GC在执行内存回收时永远无法释放掉这种无用对象所占用的内存空间,J有可能引发内存泄漏。
相对于引用计数算法而言,根搜索算法不仅同样具备实现简单和执行高效等特点,更重要的是该算法可以有效地解决在引用计数算法中一些已经死亡的对象因相互引用而导致的无法正确被标记的问题,防止内存泄漏的发生。简单来说,根搜索算法是以根对象集合为起始点,按照从上至下的方式搜索被根对象集合所连接的目标对象是否可达(使用根搜索算法后,内存中的存活对象都会被根对象集合直接或间接连接着),如果目标对象不可达,J意味着该对象已经死亡,便可以在instanceOopDesc[ HotSpot在C 代码中用instanceOopDesc类来表示Java对象,而该类继承oopDesc,所以HotSpot中的Java对象也自然拥有oopDesc所声明的头部。]的Mark World中将其标记为垃圾对象。在根搜索算法中,只有能够被根对象集合直接或者间接连接的对象才是存活对象。在HotSpot中,根对象集合中包含了5个元素,Java栈内的对象引用、本地方法栈内的对象引用、运行时常量池中的对象引用、方法区中类静态属性的对象引用以及与一个类对应的W一数据类型的Class对象。
显示全部信息
深入理解JVM与G1 GC:一本关于程序运行的艺术与科学的书籍 序言 在数字时代的浪潮中,软件如同建筑,其根基的稳固与效率的卓越,直接决定了整个体系的生命力与竞争力。而Java虚拟机(JVM)正是无数软件的生命摇篮,它以其跨平台、高效率的特性,成为了当前软件开发领域无可争议的王者。理解JVM,不仅仅是理解一个技术工具,更是洞察程序运行时内在的复杂机制,掌握优化性能的秘诀,从而写出更强大、更具韧性的代码。 本书《深入理解JVM&G1 GC》并非止步于对JVM表面的介绍,而是带领读者一层层剥开其神秘的面纱,深入到内存管理、垃圾回收、字节码执行等核心领域,特别是对现代Java应用中广泛应用的G1垃圾收集器进行详尽的解析。我们相信,只有透彻理解了JVM的运作原理,才能真正站在巨人的肩膀上,去创造更伟大的软件。 第一部分:JVM的基石——内存模型与对象生命周期 理解JVM,首先要从其内存结构入手。本书将详细剖析JVM的内存区域划分,包括程序计数器、虚拟机栈、本地方法栈、堆(Heap)以及方法区(MetaSpace)等。每一块区域的功能、作用范围以及生命周期都将一一展开。 程序计数器(Program Counter Register):作为线程的“指挥官”,它记录着当前线程执行的字节码指令的地址。我们将深入探讨其在多线程环境下如何协同工作,确保线程执行的独立性和准确性。 虚拟机栈(JVM Stacks):函数调用、局部变量、操作数栈……虚拟机栈是程序运行时计算过程的直接体现。我们会详细讲解栈帧(Stack Frame)的构成,包括局部变量表、操作数栈、动态链接、方法出口等,以及栈溢出(StackOverflowError)产生的根源和常见的排查方法。 本地方法栈(Native Method Stacks):当Java代码调用本地(非Java)方法时,就需要本地方法栈的协助。我们将简要介绍其与虚拟机栈的区别以及在特定场景下的作用。 堆(Heap):堆是Java对象生命周期的中心舞台,也是垃圾回收器(GC)的主要战场。我们将从Java对象的创建过程开始,细致讲解对象的内存布局,包括对象头、实例数据和对齐填充。这一部分将为后续的垃圾回收机制打下坚实的基础。 对象的创建过程:从`new`关键字的指令到对象在堆上的实际分配,每一步的细节都至关重要。我们将解析JVM如何进行内存分配(指针碰撞、空闲列表)以及内存分配的并发安全问题(CAS配解锁、TLAB)。 对象的内存布局:深入理解对象头(Mark Word、Klass Point)和实例数据,以及它们如何影响对象的访问和GC的判断。 对象的引用类型:强引用、软引用、弱引用、虚引用,这些不同级别的引用如何影响对象的生命周期,以及它们在内存管理中的妙用。 方法区(MetaSpace):存储类信息、常量、静态变量等。我们将探讨其在JDK8后的演进,从永久代(PermGen)到元空间(MetaSpace),以及它们在内存管理上的差异和影响。 第二部分:JVM的守护者——垃圾回收(GC)机制详解 垃圾回收是JVM自动管理内存的关键机制,它极大地简化了Java程序员的开发负担。然而,理解GC的原理,才能写出更高效、更少内存泄漏的代码。本书将深入剖析GC的各个方面。 GC的基本概念: 什么是垃圾:从可达性分析的角度,明确哪些对象是“垃圾”,哪些不是。 GC的算法: 标记-清除(Mark-Sweep):最早的GC算法,易于理解,但也存在效率和碎片化问题。 标记-整理(Mark-Compact):在标记-清除的基础上进行整理,解决了碎片化问题,但增加了开销。 复制(Copying):适用于新生代,效率高,但空间利用率不高。 Java堆的细分: 新生代(Young Generation):Eden空间、Survivor空间(S0、S1)。我们将详细讲解对象在新生代的分配、晋升(Minor GC)以及对象存活周期的判断。 老年代(Old Generation):对象在新生代中经过多次GC后仍然存活,就会被晋升到老年代。老年代的GC(Major GC/Full GC)策略与新生代有所不同。 Minor GC与Full GC:清晰区分这两种GC的触发时机、执行过程以及它们对程序性能的影响。 GC的吞吐量与停顿时间:理解GC性能的两大指标,以及如何在两者之间进行权衡。 第三部分:现代Java的利器——G1 GC深度解析 G1(Garbage-First)垃圾收集器是Oracle JDK 7u4中提供,并在JDK 9+中成为默认的垃圾收集器。它旨在解决传统GC在处理大堆时出现的长时间停顿问题,提供可预测的GC暂停时间。本书将花费大量篇幅,带领读者深入理解G1 GC的内部机制。 G1 GC的设计理念与目标: 分代区域(Region):G1 GC打破了传统的固定代际划分,将堆划分为大小相等的独立区域,每个区域可以根据需要扮演新生代或老年代的角色。 区域划分的优势:如何通过动态调整区域的角色来更好地管理内存。 软实时目标(Soft Real-time Goals):G1 GC如何通过用户设定的暂停时间目标(`-XX:MaxGCPauseMillis`)来控制GC的行为。 G1 GC的工作流程: Young GC(Garbage-First Young GC): 标记(Marking):G1如何使用SAT(Snapshot-At-The-Beginning)技术在Young GC开始时就捕获堆的快照,以避免并发问题。 复制(Copying):当Young GC发生时,G1如何将存活的对象从Young Regions复制到Survivor Regions(或直接晋升到Old Regions)。 Remembered Sets(RSets):理解GC日志中常见的“RSet”是什么,以及它是如何帮助G1 GC高效地追踪跨区域引用的。 Eager Reclaim:G1如何快速回收那些已经完全为空的Young Regions。 Concurrent Mark Cycle(并发标记周期): 初始标记(Initial Mark):一个短暂的STW(Stop-The-World)阶段,标记与GC Roots直接相连的对象。 并发标记(Concurrent Marking):GC线程与应用线程并发执行,遍历整个堆,标记所有存活的对象。 再次标记(Remark):又一个短暂的STW阶段,处理在并发标记期间发生变化的引用。 清理(Cleanup):清理不再使用的对象,并计算区域的“可回收量”(Garbage First)。 Mixed GC(混合收集): 何时触发:当并发标记周期结束后,G1会选择一些“垃圾最多”(Garbage First)的Old Regions与Young Regions一起进行回收。 如何选择Regions:G1如何根据用户设定的暂停时间目标(`-XX:MaxGCPauseMillis`)来动态选择混合回收的Region集合,以平衡吞吐量和停顿时间。 回收过程:混合回收的过程结合了Young GC的复制算法和Old GC的标记-整理思想。 G1 GC的调优参数: `-XX:MaxGCPauseMillis`:设置GC的最大暂停时间目标。 `-XX:NewRatio`:虽然G1不是严格分代的,但这个参数仍然可以影响新生代和老年代的大致比例。 `-XX:G1HeapRegionSize`:设置G1区域的大小。 `-XX:ConcGCThreads`:设置并发GC线程的数量。 `-XX:ParallelGCThreads`:设置并行GC线程的数量。 `-XX:InitiatingHeapOccupancyPercent`:触发并发标记周期的堆占用率阈值。 G1 GC的常见问题与诊断: GC日志分析:如何解读G1 GC的日志,理解GC事件的发生、耗时和内存变化。 GC暂停过长:如何分析导致GC暂停过长的原因(如:集合了太多Old Regions、并发标记耗时过长等)。 内存泄漏的排查:虽然G1是自动内存管理,但内存泄漏仍然可能发生。我们将介绍如何通过GC日志和工具来排查。 第四部分:理解字节码与性能调优 掌握了JVM的内存模型和GC机制,我们就可以更深入地理解Java程序的执行过程,并在此基础上进行性能调优。 Java字节码(Java Bytecode): JVM的语言:理解Java代码是如何被编译成字节码,并在JVM中执行的。 常用字节码指令:介绍一些关键的字节码指令,如`new`、`getfield`、`putfield`、`invokevirtual`等,了解它们与Java语言特性的对应关系。 指令重排序:在多线程环境下,JVM和CPU如何对指令进行重排序,以及这可能带来的潜在问题。 JIT编译器(Just-In-Time Compiler): C1编译器(Client Compiler):启动速度快,但优化程度较低。 C2编译器(Server Compiler):优化程度高,但启动速度慢。 分层编译(Tiered Compilation):JVM如何结合C1和C2编译器的优点,实现更优的性能。 热点代码(Hotspot Code):JIT编译器如何识别并优化经常被执行的代码。 性能调优实战: 内存分析工具:介绍Arthas、MAT(Memory Analyzer Tool)等工具,如何利用它们进行堆转储分析,查找内存泄漏和内存占用过高的对象。 CPU性能分析工具:介绍JProfiler、YourKit等工具,如何分析CPU占用率高的线程和方法。 GC日志分析实战:结合实际GC日志,演示如何找出GC的瓶颈。 避免常见的性能陷阱:如过度创建对象、频繁的字符串拼接、不恰当的同步机制等。 结语 《深入理解JVM&G1 GC》旨在为读者提供一个全面、深入的JVM和G1 GC的认知框架。我们不追求“一招鲜”的速成技巧,而是希望通过对底层原理的透彻讲解,帮助读者建立起独立思考和解决问题的能力。在复杂的软件工程领域,理解“为什么”比“怎么做”更加重要。 掌握JVM和G1 GC的精髓,意味着你能够写出更稳定、更高效的Java程序,更能从容应对各种性能挑战。希望本书能成为你探索Java世界,不断提升技术境界的有力伙伴。让我们一起,在程序运行的艺术与科学中,探索无限可能。