分类: Java
2015-07-13 21:17:58
通常数来,当优化一个Java应用的时候,我们通常重点关心的是响应时间或吞吐量两者其中的一个。再此对这两个概念做下介绍,便于加深对优化的理解。
响应时间指的是应用或者系统对一个请求数据的回应。例如:
桌面UI对鼠标事件的响应速度
网站返回页面的速度
数据库查询返回的速度
所以,对于重点关心响应时间的应用,较长时间的应用暂停时不可接受的。我们要做到尽可能的提升响应速度,减少响应时间。
吞吐量重点关心特定时间内应用程序处理工作的最大值。例如,吞吐量可以通过以下形式来衡量:
给定时间内的完成的事物数量
一个小时你完成的批处理程序的个数
一个小时内完成的数据库查询的次数
这种情况下,应用程序能容忍较高的暂停时间,因此,高吞吐量的应用程序有更长的时间基准,快速响应是不必考虑的。
自动垃圾收集机制是查看堆内存、区分在使用的对象和未使用的对象、删除未使用的对象的一个过程。对于使用对象或者引用对象,指的是你的程序持有一个指向那个对象的引用。对于未使用的对象或者是无引用对象,则不被你程序的任何部分持有引用。所以,无引用对象使用的内存是可以被重新回收利用的。
在类C语言的编程语言中,内存的分配和回收都是手动的。而在Java中,内存的回收是由垃圾回收器自动处理的。基本的步骤可以描述如下:
第一步是标记,通过这一步骤来区分哪块内存在使用,那哪块内存未使用。
引用对象用蓝色标识,未引用的对象用金色标识。在标记阶段,扫描所有的对象并判断。如果系统中所有的对象都要被扫描的,那么这一步骤可能非常耗时。
正常删除移除无引用对象,留下引用对象及指向空闲空间的指针。
内存分配器持有空闲内存的引用,这些空闲内存都链接到一个List中,当需要的时候可以分配给新的对象。
为了进一步改善性能,除了删除未引用的对象,用户也可以压缩存活的引用对象。把引用对象移动到一起,通过这种方法可以使更快速、更方便的分配新的内存。
在早期的JVM上,不得不在所有的对象上进行标记-压缩,这显然是非常低效。随着越来越多的对象被分配,对象列表也逐渐增大(扫描进而标记时间增长),这就导致越来越长的垃圾回收时间。然而,根据经验我们分析得到大部分对象的生命周期是非常短暂的。
下面是这些数据的一个例子,Y轴代表的是分配的字节数,X轴代表的是随着时间的推移分配的字节数。
从图中可以看到,随着时间的推移,分配后的对象遗留的越来越少。事实上,大多数对象有非常短的生命周期,从图中左边较高的值得宽度可以得出。
?为什么要把对象分成不同代:由于大部分分配后的对象的生命周期实际上是比较短的,在其漫长的存在时间范围中,其实际的有效生存时间所占比重较小;如果按照早期的全局标记-压缩的方法进行垃圾回收,使得内存很快会被大量已经无效的对象占用,进而使得对全局扫描标记的次数增多(无效的对象及早回收还能避免对象列表很快满了);同时对整个对象列表的扫描标记时间也较长,导致了越来越长的垃圾回收时间
从上面对象分配行为中,我们知道据此可以增强JVM的性能。因此,堆被分解为较小的三个部分或者三个代。具体分为:年轻代、老年代、持久代。
年轻代:所有创建的新对象都是在年轻代分配堆空间,在这一代变老。当年轻代被填满的时候,这就会导致一个小收集。如果对象的死亡率很高,小回收就可以获得优化。年轻代中死亡的对象越多,回收的速度也就越快。幸存对象逐渐变老(年纪增大),最终会移动到老年代。
全局暂停事件:所有的小收集(收集整个年轻代(包括S0,S1)个对象)都是一个个全局暂停事件。这意味着所有的应用线程都会停止,直到收集操作完成。小回收总会导致全局暂停事件。
老年代:老年代用于存储较长生命周期的对象。典型的说来就是,为年轻代对象设置了阈值,当年轻代逐渐变老,到达这个阈值的时候,对象就会被移动到老年代。随着时间的推移,老年代也会被填满,最终导致老年代也要进行垃圾回收。这个事件叫做大收集(是由老年代被填满来触发)。
大收集也是全局暂停事件。通常大收集比较慢,因为它涉及到所有的存活对象。所以,对于对相应时间要求高的应用,应该将大收集最小化。此外,对于大收集,全局暂停事件的暂停时长会受到用于老年代的垃圾回收器的影响。
持久代:持久代存储了描述应用程序类和方法的元数据,JVM运行应用程序的时候需要这些元数据。持久代由JVM在运行时基于应用程序所使用的类产生。此外,Java SE类库的类和方法可能也存储在这里。
如果JVM发现有些类不在被其他类所需要,同时其他类需要更多的空间,这时候这些类可能就会被垃圾回收。
从上面的介绍中我们已经理解了为什么堆被分成不同的代,下面我们就需要更精确的理解这些空间是如何进行交互的。下面的一组图片展示了JVM中垃圾回收的一般过程,从对象分配到对象逐渐变老。
现在我们已经知道垃圾收集器的一些基本原理,并且借助VisualVM可以观察到垃圾收集器的实时表现。本节将会详细讲解Java可以使用的垃圾回收器,以及在命令行如何选用配置它们。配置JVM有很多可以用的命令行参数,本节选用常用的配置参数进行详细解。
与堆配置相关的参数
Java中有很多可以使用的命令行参数,这一节将会介绍常用的一些命令行参数。
参数 | 描述 |
-Xms | JVM启动的时候设置初始堆的大小 |
-Xmx | 设置最大堆的大小 |
-Xmn | 设置年轻代的大小 |
-XX:PermSize | 设置持久代的初始的大小 |
-XX:MaxPermSize | 设置持久代的最大值 |
在Java SE 5和6中,串行收集器是客户端环境(client-style machines)机器的默认设置。在这种情况下,小垃圾收集和大垃圾收集都是串行进行的(使用单个的虚拟CPU)。
使用的算法说明:
串行收集器在年轻代使用的是拷贝算法,这个算法比较简单,在这里不做详述。而年老代和持久代使用标记-清扫-压缩(mark-sweep-compact)算法。标记阶段,收集器识别哪些对象仍然活着。清扫阶段“扫荡”整个代,识别垃圾。之后,收集器执行平移压缩(sliding compaction),将存活的对象平移到代的前端(持久代类似),相应的在尾部留下一整块连续的空闲空间。压缩后,以后的分配就可以在年老代和持久代使用空闲指针(bump-the-pointer)技术。这种压缩算法能够在堆上迅速分配内存块。
示例:大多数客户端式(client-style machines)机器上运行的应用程序通常都是选择串行收集器,这些应用对短暂停没有要求。它之所以叫这个名字,是因为它能充分利用单个虚拟处理器进行垃圾回收的工作。在今天的硬件上,串行收集器可以有效的管理许多拥有几百M堆内存的重要应用程序,并且拥有相对短的最坏暂停(Full GC仅有几秒左右)。
在有大量JVM运行在同一个机器上(在某些情况下,JVM的个数比可以用的处理器的个数多)的应用环境下,串行垃圾收集器也被广泛使用。在这种环境下,要进行垃圾回收的JVM最好使用一个处理器,虽然这样会使垃圾回收的时间变得更长,但可以降低与其他JVM的冲突。这时,使用串行垃圾回收器能够获得很好的权衡。最后,如果在较小的内存和较少的CPU核心上对硬件进行稍加扩充,将能获得更好的性能。
命令行参数:
使用串行垃圾回收器 -XX:+UseSerialGC
给事例应用使用串行垃圾回收器的命令行如下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseSerialGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
并行垃圾收集器在年轻代使用多线程进行垃圾回收。默认情况下,在N个CPU的主机上,并行垃圾收集器使用N个垃圾收集器线程进行垃圾回收。垃圾收集器线程的个数可以在命令行进行设置:-XX:ParallelGCThreads=<期望的数值>
在单核的CPU上,尽管我们请求设置的是并行垃圾收集器,但JVM还是使用默认的垃圾收集器。在两个CPU的主机上,并行垃圾收集器与默认的串行垃圾收集器所表现出来的性能相当,年轻代的垃圾收集器暂停时间与两个以上CPU的主机相比也有所减少。并行垃圾收集器有两种使用方式。
使用的算法说明:
年轻代:与串行垃圾收集器年轻代相同的拷贝算法,只不过是该算法的并行版本,使用多个CPU并行的运行,减少了垃圾收集的开销,因此增加了吞吐量。
年老代:与串行垃圾收集器老年代想听的标记-清扫-压缩(mark-sweepcompact)算法,只不过是该算法的并行版本。
示例:并行收集器也叫做吞吐量收集器,因为其可以使用多个CPU来增大应用程序的吞吐量。当应用程序需要处理大量的工作同事可以接受较长的暂停时,可以使用并行垃圾收集器。例如,想打印报告或者账单这样的批处理,或者进行大量的数据库查询。
-XX:+UseParallelGC
使用这个命令行参数,就会将年轻代设置为多线程的收集器,老年代使用单线程的收集器。该选项,还会在老年代进行单线程的压缩工作。
启动示例应用程序Java2Demo的命令行如下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseParallelGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
-XX:+UseParallelOldGC
使用该参数,年轻代和老年代都会使用多线程的收集器,同时,也使用多线程的压缩收集器。HotSpot仅仅在老年代进行整理,在年轻代是一个复制收集器,因此没必要进行整理。
压缩描述的是这样一种行为,移动对象使得个对象之间没有空闲位置。再一次垃圾收集的清理之后,存活对象在内存中的存储位置之间可能存在空闲区。整理移动对象,使得对象的存储都是顺序的,彼此之间没有空闲区。垃圾收集器可能也是一个不带压缩的收集器。所以,并行收集器和并行压缩收集器之间的区别就是后者在垃圾收集清理操作之后,对内存空间进行一次整理。
启动示例应用程序Java2Demo的命令行如下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseParallelOldGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
并发标记清理收集器(CMS,又叫作并发低暂停收集器)在老年代进行收集。由于垃圾收集能使用应用线程的并发进行大多数的垃圾收集工作,所以它降低了应用程序的暂停时间。
正常说来,并发低暂停的收集器对存活对象不进行复制和压缩的工作。这种情况下,垃圾收集器没有移动任何存活对象。如果因此而带来了内存的碎片问题,那就为其分配一个更大的堆。
注意:CMS收集器在年轻代使用和并行收集器一样的算法。
示例:CMS收集器常常应用于需要低暂停及可以与垃圾收集器共享资源的场景。例如:桌面UI应用程序对事件的响应,Web服务器对请求的响应,以及数据库对查询请求的响应。
命令行参数:
如果要使用CMS收集器,使用 -XX:+UseConcMarkSweepGC ,同时,可以设置并发的线程数目 -XX:ParallelCMSThreads=<n> 。
启动示例应用程序Java2Demo的命令行如下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseConcMarkSweepGC -XX:ParallelCMSThreads=2 -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
在Java 7中可以使用G1垃圾回收器,它设计的初衷是用于长期取代CMS收集器。G1垃圾收集器是一个并行、并发,同时也是基于增量整理的低暂停垃圾收集器。与前面所描述的垃圾收集器相比,从布局方面与它们有很大的不同。但本文不对该部分做详细的说明,有兴趣可以参考具体的文献资料。
命令行参数:
如果要使用CMS收集器,使用 -XX:+UseG1GC
启动示例应用程序Java2Demo的命令行如下:
java -Xmx12m -Xms3m -XX:+UseG1GC -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar