分类: Java
2010-11-18 10:57:25
java不像C++那样需要显示的分配和释放内存,对java程序员是一种解放,很大程度降低了编程的难度,因为内存管理的工作都交由jvm来自动进行。但是jvm自动管理内存也是一把双刃剑,会造成宝贵的内存资源浪费,搞不好还会造成内存泄露。所以,最为一名java程序员需要对jvm管理内存的机制进行深入了解,才能更好的利用内存。
Sun JDK也是遵照jvm规范,将内存空间划分为方法区、堆、本地方法栈、pc寄存器、jvm方法栈。如下图:
方法区存放了要加载的类的信息、类中的静态变量、类中定义为final类型的常量、类中的field信息、类中的方法信息。方法区是全局共享的,特定条件下会进行GC,当方法区要使用的内存大于运行大小时会抛OOM异常。
Sun JDK中这块内存对应Permanent Generation,也叫持久代,默认最小16M,最大64M,通过-XX:PermSize和-XX:MaxPermSize参数指定持久代的最小和最大值。
堆用于存储对象实例及数组值,可以认为java中所有通过new操作符创建的对象都放在堆中,堆中对象由GC进行回收。这块内存大小可以通过两个参数进行指定:-Xms和-Xmx。
-Xms表示jvm启动时申请的最小heap内存,默认为物理内存的1/64但小于1G。
-Xmx表示jvm可申请的最大heap内存,默认为物理内存的1/4但小于1G。
默认当空闲堆内存小于40%是,jvm会增大heap到-Xmx指定的大小,这个比例可以通过参数-XX:MinHeapFreeRatio=来指定;默认当空闲堆内存大于70%时,jvm会减小heap到-Xms指定的大小,这个比例可以通过参数-XX:MaxHeapFreeRatio=来指定。建议将-Xms和-Xmx设置为相同的值,以避免频繁调整jvm堆大小。
由于不同对象在内存中存活的时间不同,有的很快就可以回收,有的可能生命周期贯穿整个jvm的生命周期,所以在Sun JDK从1.2开始就对堆内存进行分代管理。如下图:
大多数情况下java程序中创建的对象都是从新生代分配内存,新生代有两部分组成:Eden space和两块大小相等的Survivor space(S0和S1)。
可以通过参数-Xmn来指定新生代的大小,通过-XX:SurvivorRatio来指定Eden space和Survivor space的大小。
旧生代主要用于存放经过多次垃圾回收仍然存活的对象,但在某些情况下第一次创建对象就直接在旧生代分配内存,比如:大对象,可以通过参数-XX:PretenureSizeThreshold=(单位为字节,默认为0)指定当对象大小超过多大时直接放入旧生代;大数组对象,且数组中无外部引用对象。
本地方法栈用于支持native方法的执行,Sun JDK中的实现是本地方法栈和jvm方法栈是同一个。
每个线程都有自己的PC寄存器和jvm方法栈,pc寄存器占用的可能是cpu寄存器或操作系统内存,jvm方法栈占用的为操作系统内存,jvm方法栈为线程私有,线程运行完毕时其对应栈帧所占用的内存全部自动释放掉。
Sun JDK中通过参数-Xss来指定jvm方法栈大小,当jvm方法栈空间不足时抛StackOverflowError.
jvm堆是所有线程共享的,因此在堆上分配内存需要加锁,从而导致创建对象开销较大。当堆空间不足时会触发GC,如果GC后堆空间仍然不足会跑OutOfMemory异常。
Sun JDK为提升内存分配效率,在新生代的Eden space为每个线程创建一个叫做TLAB(Thread Local Allocation Buffer)的区域,当在线程中创建对象时jvm会尽量在TLAB中分配内存,这时就不需要加锁,节省了创建对象的开销。
还有一种基于逃逸分析的方法,jvm会在栈上直接分配内存,线程结束时自动就释放掉。
jvm通过GC来回收内存,GC就是通过分析程序中不再被使用的对象,把这些对象所占内存收回,GC通常采用收集器方式,主要有引用计数收集器和跟踪收集器。
引用计数器采用分散的管理方式,通过记录对象的引用次数进行判断对象是否可能回收,当对象的引用计数为0时GC就可以回收该对象。但是引用计数器方式有他的缺点:每次对对象的赋值操作都会伴随有引用计数的增减,带来一定的额外消耗;对象间出现循环引用时会失效。所以Sun JDK实现中没有采用引用计数器的方式。
跟踪收集器采用集中式的管理方式,全局记录数据的引用状态,执行GC时从根集合进行对象扫描,可能会造成应用程序暂停,线程阻塞。主要有复制(copying),标记-清除(mark-sweep),标记-压缩(mark-compact)三种算法实现。
新生代中对象通常存活时间短,对象少,所以选择copying算法实现新生代的GC。GC过程中复制对象时需要一块未使用的内存区来存放存活的对象,这也是新生代划分为Eden,S0,S1的原因。Eden存放刚创建的对象,S0或S1的其中一块用作Minor GC的复制目标空间,另一块被清空;下一次Minor GC时S0和S1交换角色。
在整个扫描和复制过程采用单线程的方式来进行,适用于单CPU、新生代空间较小及对暂停时间要求不是非常高的应用上,是client级别默认的GC方式,可以通过-XX:+UseSerialGC来强制指定。
在整个扫描和复制过程采用多线程的方式来进行,适用于多CPU、对暂停时间要求较短的应用上,是server级别默认采用的GC方式,可用-XX:+UseParallelGC来强制指定,用-XX:ParallelGCThreads=4来指定线程数。
与旧生代的并发GC配合使用。
旧生代与新生代不同,对象存活的时间比较长,比较稳定,因此采用标记(Mark)算法来进行回收,所谓标记就是扫描出存活的对象,然后再进行回收未被标记的对象,回收后对用空出的空间要么进行合并,要么标记出来便于下次进行分配,总之就是要减少内存碎片带来的效率损耗。在执行机制上JVM提供了串行GC(Serial MSC)、并行GC(parallel MSC)和并发GC(CMS)。
创建对象(尤其是大对象)可能会触发GC,所以需要频繁创建的对象可以考虑通过池来解决;
注意对象的作用域,不用的及时显示设置为null,GC就可以收掉;
通过设置jvm参数对应用调优,有很多工具来帮助分析jvm内存使用清空,茹jconsole,jstat,jmap等等,但要具体系统具体分析,总之尽量减少GC,尤其是Full GC(会导致线程阻塞)。