Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1115211
  • 博文数量: 143
  • 博客积分: 969
  • 博客等级: 准尉
  • 技术积分: 1765
  • 用 户 组: 普通用户
  • 注册时间: 2011-07-30 12:09
文章分类

全部博文(143)

文章存档

2023年(4)

2021年(2)

2020年(4)

2019年(4)

2018年(33)

2017年(6)

2016年(13)

2014年(7)

2013年(23)

2012年(33)

2011年(14)

我的朋友

分类: 架构设计与优化

2013-05-11 21:55:41

今年年初由于facebook而火起jemalloc广人之,但殊不知,malloc界里面很早就出名了。Jemalloc始人Jason Evans也是在FreeBSD很有名的开发。此人就在2006提高低性能的mallocjemallocJemalloc2007始以FreeBSD准引进来的。件技革新很多是FreeBSD起的。在FreeBSD用广泛的技术会慢慢入到linux

目前jemallocfirefox中也在使用。在firefox2中出存碎片问题之后,便在firefox3中使用了jemalloc。在safarichrome中使用的是googletcmalloc

Jemalloc的技特性

Jemalloc聚集了malloc的使用程中所验证的很多技。忽略细节着眼,最出色的部分仍是arenathread cache。(事上,这两个与tcmalloc的架几乎相同。Jemalloc only的部分将会在另一次posting继续

Arena

其像malloc集中管理一整块内存,不如其分成块来分而治之。此小便称为arena想象一下,小朋友一图纸们随意地点。果可想而知,他肯定相互方而不敢肆意地synchronization),而影响画图效率。但是如果老事先在大图纸分好每人的域,小朋友就可以又快又准地在各自地域上画图这样念就是arena

Thread cache

如果是辟小块内存,使不arena而直接malloc各自的线thread cache域。此ideagoogletcmalloc的核心部分,亦在jemalloc中体

再拿上面的例子,小朋友除了一图纸外,再各自A4这样,小朋友在不大面的点,只在自己的A4上心情地即可(no arena seeking)。可以在自己手上的或涂(using thread cache),完全不用人(no synchronization, no locking),迅速有效地

jemalloc的核心layout。看着复杂,其都是上面明的部分。


更好的内存管理-jemalloc - Alex - wangkaisino的博客

 

实际jemalloc的性能呢?

更好的内存管理-jemalloc - Alex - wangkaisino的博客

 


最左的就是glibcmalloc,最右的就是jemalloc从图表上可以看出,jemalloc的性能有glibc倍以上。非常倒性的性能差。因此,使用了jemalloc用程序自然快很多。Jemalloc的就是tcmallocTcmalloc的性能其相差甚微,低jemalloc2.1.04.5%上和tcmalloc1.4版本,而如今到了1.6版本,因此实际这两应该是不相仲伯的。Jemalloc始人jason evans也意一点,cpu core 8以上的算机上jemalloc效率更高。

程序的最后的免午餐  kth分布式技lab      

2005表了一篇文章午餐的束了在之前,程序就算不用费脑子,cpu时钟速度增加,程序性能自己就上去。但在不同,cpu时钟趋定,而核地增加。程序需要适应这样的多线程多程的境,开发出适合的程序。文章的大这样容。

6年之后的如今,篇文章完全现实了。事cpu时钟停留在3GHz,而核不上升。在程序要适线程多程的分布式算,速度才能上升。但是这样的程序很

在在多线程的境下,程序员们的最后一道午餐便是tcmallocjemalloc这样malloc library于使用多线程的程序而言,性能提高%

共享一下我本人的经验。我本人在kth术研究所分布式技lab中承担iLock(分布式同步工具,请参googlechubby)。在iLock中用了googletcmalloc果,性能提升了18~22%

最大的点就是不需要做任何复杂的工作便可得到这样的效果。不需要代编译。只需在行二制之前,在cmd窗口中

$ LD_PRELOAD=tcmalloc所设置的文件夹/libtcmalloc.so

这样在之后行的用程序使用tcmallocjemalloc而代替glibcmallocptmalloc)。置此,我便可得到性能20%的提升,这真是送的最后的免午餐。

如今,在分布式技lab中使用googletcmalloc。原因在于性能上者差不多,但googletcmalloc所提供的程序分析工具非常(heap profiler, cpu profiler)丰富。所以tcmalloc可能更方便一些。

一定要使用最新的malloc?一定要的!

阅读(2234) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~