《深入理解Java虚拟机》之GC

内存动态分配和垃圾收集技术

GC:哪些内存需要回收?什么时候回收?如何回收?

当需要排查各种内存溢出、内存泄露问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,就需要对内存动态分配和垃圾收集技术实施必要的监控和调节。

垃圾收集器关注的是Java堆和方法区中的动态分配和回收的内存。

判断对象存活与否?

1、引用计数算法:主流的Java虚拟机未采用,很难解决对象之间相互循环引用的问题

2、可达性分析算法:判定对象是否可回收

对象真正死亡:至少经历两次标记过程:finalize()最多执行一次


一、垃圾收集算法:

1.标记-清除算法 Mark and Sweep

分为标记和清除两个阶段,是最基础的收集算法,主要不足:1、效率问题;2、空间问题:标记清除之后会产生大量不连续的内存碎片,导致之后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次GC。

2.复制算法 Copying

一块内存平均划分为2块,一块空闲,一块存储,当回收的时候,把另一半中仍然存活的复制过来,并将其内存全部收回——解决了效率问题(每次都是对半个区域进行内存回收,内存分配时也不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单运行高效)。比较适合“朝生夕死”的新生代对象。

Eden:Survivor0:Survivor = 8:1:1

3.标记-整理算法 Mark-Compact

标记以后,让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。适用于老年代,绝大多数对象都存活的情况。

4.分代收集算法

一般将Java堆分为新生代和老年代,对于新生代,每次收集时都发现有大批对象死去,只有少量存活,就选用复制算法,只需付出少量复制成本即可完成回收。而老年代中对象存活率高,没有额外空间对其进行担保,就必须使用“标记清除”或者“标记整理”算法回收。

一般新生代触发内存回收称之为Yong GC,而老年代大对象触发内存回收称之为Full GC

Young区(新生代),Elden区(老年代),Survivor区(永久代):S0,S1,Meta Space,S0:S1=9:1


Java内存:堆内存、栈内存、方法区

堆内存:基本数据类型,引用类型,Java8之后常量池移动堆中

栈内存:递归无终止条件会导致StackOverFlowError,栈空间的耗尽

方法区:函数,方法名


二、垃圾回收器

收集算法是内存回收的方法论,垃圾收集器是内存回收的具体实现。

7种作用于不同分代的收集器:

特性、基本原理和使用场景:

重点分析CMS和G1相对复杂的收集器,了解运作细节。

  • 新生代:Serial、ParNew、Praralell Scavenge

  • 老年代:CMS、Serial Old、Parallel Old、G1

1、Serial收集器

单线程,stop the world,是虚拟机运行在Client模式下的默认新生代收集器,与其他收集器的单线程相比,简单而高效。对于限定单个CPU的环境而言,Serial由于没有线程交互的开销,可以获得最高的单线程收集效率。

新生代采取复制算法,而老年代采取标记-整理算法。

2、ParNew收集器

是Serial的多线程版本,行为包括:Serial可用的所有控制参数、收集算法、stop the world、对象分配规则、回收策略。这两种收集器共用了不少代码。

-XX:ParallelGCThreads用来限制垃圾收集的线程数,ParNew收集器是使用-XX:+UseConcMarkSweepGC后的默认新生代收集器。可以使用-XX:+UseParNewGC强制使用。

3、Praralell Scavenge(清除)收集器

复制算法,并行的多线程收集器,目标是达到可控制的吞吐量(吞吐量优先收集器),吞吐量=运行用户代码时间/(运行用户代码时间+GC时间),低停顿时间有利于提高响应速度,因而适合交互较多的程序,高吞吐量可以高效利用CPU时间,尽快完成程序的运算任务,主要适合后台计算。

精确控制吞吐量的参数:-XX:MaxGCPauseMillis(控制最大GC停顿时间),-XX:GCTimeRatio(直接设置吞吐量大小)

GC停顿时间缩短是以牺牲吞吐量和新生代空间为代价的。

自适应调节策略:-XX:+UseAdaptiveSizePolicy 开启GC自适应调节策略后,无需手工指定新生代的大小(-Xmn)、Eden与Survivor区的比例(-XX:SurvivorRatio)、晋升老年代对象大小(-XX:PretenureSizeThreshold)等参数,虚拟机会根据当前系统运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量。

4、Serial Old收集器

单线程、标记-整理算法、老年代,给Client模式的VM使用,Server模式下,作为CMS的后备预案(在并发收集发生Concurrent Mode failure时使用)

5、Parallel Old收集器

是Praralell Scavenge的老年代版本,多线程,标记-整理算法,在注重吞吐量以及CPU资源敏感的场合,可以优先考虑使用Praralell Scavenge+Praralell Old组合。


相关问题:

1.哪些对象可以作为引用链的 Root 对象?

答:引用链的 Root 对象可以为以下内容:

  • Java 虚拟机栈中的引用对象;
  • 本地方法栈中 JNI(既一般说的 Native 方法)引用的对象;
  • 方法区中类静态常量的引用对象;
  • 方法区中常量的引用对象。

2.对象引用关系都有哪些?

答:不管是引用计数法还是可达性分析算法都与对象的“引用”有关,这说明对象的引用决定了对象的生死,对象的引用关系如下。

  • 强引用:在代码中普遍存在的,类似 Object obj = new Object() 这类引用,只要强引用还在,垃圾收集器永远不会回收掉被引用的对象。
  • 软引用:是一种相对强引用弱化一些的引用,可以让对象豁免一些垃圾收集,只有当JVM 认为内存不足时,才会去试图回收软引用指向的对象,JVM 会确保在抛出 OutOfMemoryError 之前,清理软引用指向的对象。
  • 弱引用:非必需对象,但它的强度比软引用更弱,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。
  • 虚引用:也称为幽灵引用或幻影引用,是最弱的一种引用关系,无法通过虚引用来获取一个对象实例,为对象设置虚引用的目的只有一个,就是当这个对象被收集器回收时收到一条系统通知。

3.垃圾回收算法有哪些?

答:垃圾回收算法如下。

  • 引用计数器算法:引用计算器判断对象是否存活的算法是这样的,给每一个对象设置一个引用计数器,每当有一个地方引用这个对象的时候,计数器就加 1,与之相反,每当引用失效的时候就减 1。
  • 可达性分析算法:在主流的语言的主流实现中,比如 Java、C#,甚至是古老的 Lisp 都是使用的可达性分析算法来判断对象是否存活的。这个算法的核心思路就是通过一些列的“GC Roots”对象作为起始点,从这些对象开始往下搜索,搜索所经过的路径称之为“引用链”。当一个对象到 GC Roots 没有任何引用链相连的时候,证明此对象是可以被回收的。
  • 复制算法:复制算法是将内存分为大小相同的两块,当这一块使用完了,就把当前存活的对象复制到另一块,然后一次性清空当前区块。此算法的缺点是只能利用一半的内存空间。
  • 标记-清除算法:此算法执行分两阶段,第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用,同时,会产生内存碎片。
  • 标记-整理:此算法结合了“标记-清除”和“复制”两个算法的优点。分为两个阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,把清除未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。

4.垃圾回收的分类都有哪些?

答:垃圾回收的分类如下:

  • 新生代回收器:Serial、ParNew、Parallel Scavenge
  • 老年代回收器:Serial Old、Parallel Old、CMS
  • 整堆回收器:G1

5.分代垃圾回收器的组成部分有哪些?

答:分代垃圾回收器是由:新生代(Young Generation)和老生代(Tenured Generation)组成的,默认情况下新生代和老生代的内存比例是 1:2。

6.新生代的组成部分有哪些?

答:新生代是由:Eden、Form Survivor、To Survivor 三个区域组成的,它们内存默认占比是 8:1:1。

7.新生代垃圾回收是怎么执行的?

答:新生代垃圾回收的执行过程如下:

① Eden 区 + From Survivor 区存活着的对象复制到 To Survivor 区;
② 清空 Eden 和 From Survivor 分区;
③ From Survivor 和 To Survivor 分区交换(From 变 To,To 变 From)。

8.为什么新生代有两个 Survivor 分区?

答:当新生代的 Survivor 分区为 2 个的时候,不论是空间利用率还是程序运行的效率都是最优的。

  • 如果 Survivor 是 0 的话,也就是说新生代只有一个 Eden 分区,每次垃圾回收之后,存活的对象都会进入老生代,这样老生代的内存空间很快就被占满了,从而触发最耗时的 Full GC ,显然这样的收集器的效率是我们完全不能接受的。
  • 如果 Survivor 分区是 1 个的话,假设把两个区域分为 1:1,那么任何时候都有一半的内存空间是闲置的,显然空间利用率太低不是最佳的方案。但如果设置内存空间的比例是 8:2 ,只是看起来似乎“很好”,假设新生代的内存为 100 MB( Survivor 大小为 20 MB ),现在有 70 MB 对象进行垃圾回收之后,剩余活跃的对象为 15 MB 进入 Survivor 区,这个时候新生代可用的内存空间只剩了 5 MB,这样很快又要进行垃圾回收操作,显然这种垃圾回收器最大的问题就在于,需要频繁进行垃圾回收。
  • 如果 Survivor 分区有 2 个分区,我们就可以把 Eden、From Survivor、To Survivor 分区内存比例设置为 8:1:1 ,那么任何时候新生代内存的利用率都 90% ,这样空间利用率基本是符合预期的。再者就是虚拟机的大部分对象都符合“朝生夕死”的特性,因此每次新对象的产生都在空间占比比较大的 Eden 区,垃圾回收之后再把存活的对象方法存入 Survivor 区,如果是 Survivor 区存活的对象,那么“年龄”就 +1 ,当年龄增长到 15 (可通过 -XX:+MaxTenuringThreshold 设定)对象就升级到老生代。

经过以上对比,可以得出结论,当新生代的 Survivor 分区为 2 个的时候,不论是空间利用率还是程序运行的效率都是最优的。

9.什么是 CMS 垃圾回收器?

答:CMS(Concurrent Mark Sweep)一种以获得最短停顿时间为目标的收集器,非常适用 B/S 系统。

10.CMS 垃圾回收器有哪些优缺点?

答:CMS 垃圾回收器的优点是使用多线程,标记清除垃圾的,它缺点如下。

  • 对 CPU 资源要求敏感:CMS 回收器过分依赖于多线程环境,默认情况下,开启的线程数为(CPU 的数量 + 3)/ 4,当 CPU 数量少于 4 个时,CMS 对用户本身的操作的影响将会很大,因为要分出一半的运算能力去执行回收器线程;
  • CMS 无法清除浮动垃圾:浮动垃圾指的是 CMS 清除垃圾的时候,还有用户线程产生新的垃圾,这部分未被标记的垃圾叫做“浮动垃圾”,只能在下次 GC 的时候进行清除;
  • CMS 垃圾回收会产生大量空间碎片:CMS 使用的是标记-清除算法,所有在垃圾回收的时候回产生大量的空间碎片。

11.什么是 G1 垃圾回收器?

答:G1 垃圾回收器是一种兼顾吞吐量和停顿时间的 GC 实现,是 JDK 9 以后的默认 GC 选项。G1 可以直观的设定停顿时间的目标,相比于 CMS CG,G1 未必能做到 CMS 在最好情况下的延时停顿,但是最差情况要好很多。

G1 GC 仍然存在着年代的概念,但是其内存结构并不是简单的条带式划分,而是类似棋盘的一个个 Region。Region 之间是复制算法,但整体上实际可看作是标记 - 整理(Mark-Compact)算法,可以有效地避免内存碎片,尤其是当 Java 堆非常大的时候,G1 的优势更加明显。

12.垃圾回收的调优参数有哪些?

答:垃圾回收的常用调优如下:

  • -Xmx:512 设置最大堆内存为 512 M;
  • -Xms:215 初始堆内存为 215 M;
  • -XX:MaxNewSize 设置最大年轻区内存;
  • -XX:MaxTenuringThreshold=5 设置新生代对象经过 5 次 GC 晋升到老年代;
  • -XX:PretrnureSizeThreshold 设置大对象的值,超过这个值的大对象直接进入老生代;
  • -XX:NewRatio 设置分代垃圾回收器新生代和老生代内存占比;
  • -XX:SurvivorRatio 设置新生代 Eden、Form Survivor、To Survivor 占比。
请我吃辣条吧~~ 谢谢打赏
0%