JVM优化之调整大内存分页(LargePage)
本文将从内存分页的原理,如何调整分页大小两节内容,向你阐述LargePage对JVM的性能有何提升作用,并在文末点明了大内分页的副作用。OK,让我们开始吧!
内存分页大小对性能的提升原理
首先,我们需要回顾一小部分计算机组成原理,这对理解大内存分页至于JVM性能的提升是有好处的。
什么是内存分页?
我们知道,CPU是通过寻址来访问内存的。32位CPU的寻址宽度是 0~0xFFFFFFFF ,计算后得到的大小是4G,也就是说可支持的物理内存最大是4G。
但在实践过程中,碰到了这样的问题,程序需要使用4G内存,而可用物理内存小于4G,导致程序不得不降低内存占用。
为了解决此类问题,现代CPU引入了 MMU(Memory Management Unit 内存管理单元)。
MMU 的核心思想是利用虚拟地址替代物理地址,即CPU寻址时使用虚址,由 MMU 负责将虚址映射为物理地址。
MMU的引入,解决了对物理内存的限制,对程序来说,就像自己在使用4G内存一样。
内存分页(Paging)是在使用MMU的基础上,提出的一种内存管理机制。它将虚拟地址和物理地址按固定大小(4K)分割成页(page)和页帧(page frame),并保证页与页帧的大小相同。
这种机制,从数据结构上,保证了访问内存的高效,并使OS能支持非连续性的内存分配。
在程序内存不够用时,还可以将不常用的物理内存页转移到其他存储设备上,比如磁盘,这就是大家耳熟能详的虚拟内存。
在上文中提到,虚拟地址与物理地址需要通过映射,才能使CPU正常工作。
而映射就需要存储映射表。在现代CPU架构中,映射关系通常被存储在物理内存上一个被称之为页表(page table)的地方。
如下图:

从这张图中,可以清晰地看到CPU与页表,物理内存之间的交互关系。
进一步优化,引入TLB(Translation lookaside buffer,页表寄存器缓冲)
由上一节可知,页表是被存储在内存中的。我们知道CPU通过总线访问内存,肯定慢于直接访问寄存器的。
为了进一步优化性能,现代CPU架构引入了TLB,用来缓存一部分经常访问的页表内容。
如下图:

对比 9.6 那张图,在中间加入了TLB。
为什么要支持大内存分页?
TLB是有限的,这点毫无疑问。当超出TLB的存储极限时,就会发生 TLB miss,之后,OS就会命令CPU去访问内存上的页表。如果频繁的出现TLB miss,程序的性能会下降地很快。
为了让TLB可以存储更多的页地址映射关系,我们的做法是调大内存分页大小。
如果一个页4M,对比一个页4K,前者可以让TLB多存储1000个页地址映射关系,性能的提升是比较可观的。
调整OS和JVM内存分页
在Linux和windows下要启用大内存页,有一些限制和设置步骤。
Linux:
限制:需要2.6内核以上或2.4内核已打大内存页补丁。
确认是否支持,请在终端敲如下命令:
# cat /proc/meminfo | grep Huge
HugePages_Total: 0
HugePages_Free: 0
Hugepagesize: 2048 kB
如果有HugePage字样的输出内容,说明你的OS是支持大内存分页的。Hugepagesize就是默认的大内存页size。
接下来,为了让JVM可以调整大内存页size,需要设置下OS 共享内存段最大值 和 大内存页数量。
共享内存段最大值
建议这个值大于Java Heap size,这个例子里设置了4G内存。
# echo 4294967295 > /proc/sys/kernel/shmmax
大内存页数量
# echo 154 > /proc/sys/vm/nr_hugepages
这个值一般是 Java进程占用最大内存/单个页的大小 ,比如java设置 1.5G,单个页 10M,那么数量为 1536/10 = 154。
注意:因为proc是内存FS,为了不让你的设置在重启后被冲掉,建议写个脚本放到 init 阶段(rc.local)。
Windows:
限制:仅支持 windows server 2003 以上server版本
操作步骤:
- Control Panel -> Administrative Tools -> Local Security Policy
- Local Policies -> User Rights Assignment
- 双击 “Lock pages in memory”, 添加用户和组
- 重启电脑
注意: 需要管理员操作。
单个页大小调整
JVM启用时加参数 -XX:LargePageSizeInBytes=10m
如果JDK是在1.5 update5以前的,还需要手动加 -XX:+UseLargePages,作用是启用大内存页支持。
大内存分页的副作用
因为每页size变大了,导致JVM在计算Heap内部分区(perm, new, old)内存占用比例时,会出现超出正常值的划分。最坏情况下是,某个区会多占用一个页的大小。不过后续jvm版本也在调整这个策略。
一般情况,不建议将页size调得太大,4-64M,是可以接受的(默认是4M)。为了合理设置这个值,你应该对你的系统做一下benchmark。
说实话,网上我见过调得最猛的,有调到256M,从benchmark报表上看,性能不是太坏。如果你有64位的大内存机器,不妨尝试一下。
另外,网上有很多GC调优的文章内容中都有提到 LargePageSizeInBytes,但未提任何OS限制。在OS不支持的情况下,设置这个参数,这个参数将仅仅是个摆设。
作者:Ken Wu 原文链接:http://kenwublog.com/tune-large-page-for-jvm-optimization
大学的计算机课程白混了,基础的东西一点都没学到,那时候天真的以为,用java写一个计算器那么酷,谁会去搞XX的计算机原理,还不如去学生会搞搞有前途,谁知,原本做销售的我,却成了个写程序的,弄了几年一直写个jsp啥的,现在终于明白,原来高手高手高高手都在搞cpu,寄存器,内存,分页。
心里灰了,咋办呢。既然写了程序,就安了吧,从现在开始再关注关注基本,原理的东西,即使成不了高高手,成个小半高手也成啊。
人生,杯具。
呵呵,唠叨了些,见谅,实在是楼主的这篇文写的太好,像我这种嘛玩意不懂的居然也看懂了,也居然试着去公司的服务器上看看内存分页大小,也居然要啰嗦些人生,功德无量啊。
强烈推荐这篇文章,也许你不一定有机会去真正的去实践一下,至少会让你对计算原理有一些了解。原来这玩意也很酷。
能看懂就好,呵呵,为了写得通俗易懂,我尽量避开了一些概念性的东西。比如MMU,wikipedia的解释比我这写的深入多了。
问一句:难道阿里,淘宝的调优,真的到了需要增大内存分页的地步?
非也,我们生产环境大部分java应用都没调过large page。性能瓶颈也不是在jvm上。
文章里提到的优化,仅仅是实验性质的。
优化对我们来说,是一个循序渐进的过程。我们追求的是效果明显的优化方案,而不是什么都调优一把。
没数据没真相
写得很好,不过最后能提供一组性能比较数据就完美了!
网上我见过调得最猛的是,256M,从benchmark报表上看,不是太坏。如果你是64位的大内存机器,不妨尝试一下。
~~~~~~~~~~~~~~~~~~~~~具体数据呢 ?
不好意思,稍后补上!
/proc/sys/kernel/shmmax 这个值在安装Oracle时好像也要设置,
JVM在内存的管理上越来越多的借鉴了Oracle等优秀软件的内存管理方式了。
呵呵
哇!又发现一个好博客!对于我这个刚出来工作的毕业生真的太好了!谢谢博主!
不知道为什么!一看到这些好博客心里就有种莫名奇妙的感动或者感激!大学四年,什么课都没好好上,就是自己自学!正是这些博客才能使我这个一般本科的毕业生能进到国内的大公司拿高薪!感谢这些对知识的传播者!