Chinaunix首页 | 论坛 | 博客
  • 博客访问: 12024
  • 博文数量: 7
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 65
  • 用 户 组: 普通用户
  • 注册时间: 2014-08-28 16:28
文章分类
文章存档

2014年(7)

我的朋友
最近访客

分类: 高性能计算

2014-09-12 09:38:23

【PConline 资讯】在今年的IDF2014上,Intel正式发布了新一代与工作站处理器Xeon E5-2600(开发代号Haswell-EP)系列。最高18核心36线程、45MB三级缓存、DDR4内存……仅仅是这几个关键字,就足以让整个微处理器行业震撼不已。不过,最高2.6万元人民币一颗的售价会带来什么样的性能呢?

001

  新的E5-2600系列处理器刚刚发布,AnandTech就在第一时间搞到了这个传说中的18核心性能怪兽(E5-2699 v3),以及它的14/12/8核心小弟,然后纠集了一帮上一代的Xeon E5处理器以及竞争对手AMD的超高性能的Opteron处理器,进行了一次巅峰的对决。

测试平台

  测试平台是三台双路服务器,主角是Intel提供的参考设计方案“Wildcat Pass”,处理器可选四颗: Xeon E5-2699 v3 (18核心/45MB/2.3-3.6GHz/145W)、Xeon E5-2695 v3 (14核心/35MB/2.3-3.3GHz/120W)、Xeon E5-2667 v3 (8核心/20MB/3.2-3.6GHz/135W)、 Xeon E5-2650L v3 (12核心/30MB/1.8-2.5GHz/65W)。内存选择了来自三星的DDR4-2133,分为两种规格:6GB×8 RDIMM、32GB×8 LRDIMM。

  第二台是Supermicro 6027R-73DARF,处理器可选三颗,包括两颗Ivy Bridge-EP和一颗Sandy Bridge-EP: Xeon E5-2697 v2 (12核心/30MB/2.7-3.5GHz/130W)、 Xeon E5-2680 v2 (10核心/25MB/2.8-3.6GHz/115W)、Xeon E5-2690 v1 (8核心/20MB/2.9-3.8GHz/135W)。内存是三星16GB×8 DDR3,频率v2 1866MHz、v1 1600MHz。

  第三台是AMD Supermicro 1022G-URG服务器,配备两颗Opteron 6376,均为8模块16核心,主频2.3-3.2GHz,三级缓存16MB,热设计功耗115W。这并非AMD最顶级的产品,旗舰是Opteron 6386 SE,也是16核心,但频率达2.8-3.5GHz,热设计功耗140W。搭配内存是三星8GB×8 DDR3-1600。

  测试平台都搭载了两块Intel SSD 710 200GB固态,但因为控制器问题没有测试模式。处理器节能技术全部开启。不过具体原理和影响的内容我们就不过多深究了,只是单纯地看看图表和数据,瞻仰一下18核心的威猛。

1
双路Xeon E5-2600 v3服务器(Intel参考设计)

2
IVB-EP 2600 v2、Haswell-EP 2600 v3型号规格对比

  平台搭建完毕,进入到我们的实测环节。

z1


2内存带宽、延迟测试回顶部


内存、延迟测试

  在测试中我们可以看到,DDR4的高带宽优势凸显无疑,即便是在2133MHz的起步频率上,都比DDR3-1866增加了15-21%,对比DDR3-1600多了更是超出几乎50%。Xeon E5-2699 v3、2695 v3火力全开的同时,2667 v3却大失所望,成绩和上代2697 v3完全相同,这主要是它们其实是两种内核,环形总线、内存控制器分布设计不同所致,前者有四条总线、两个内存控制器。

3

  LRDIMM、RDIMM带宽对比,这个我们就不管了。

4

  另外,我们看到三级缓存太大对性能的提高不一定有益。2699 v3 45MB的延迟为20-32ns,2690 20MB则只有15-20ns,分别相当于大约90个、60个周期。但这也不是全部,2667 v3 20MB就只比2690慢一点点,仍然快于2697 v2 30MB。

5

  DDR4-2133的速度也远远不及三级缓存,后者要快三四倍。另一方面,DDR4-2133的延迟似乎和DDR3-1866差不多,因此如果前者频率超过2400MHz,性能优势将会彻底释放。

66 

单、多线程性能测试

  Intel这几年很好地把握了核心、频率之间的平衡,结果就是单线程性能变化并不大在只需要一两个核心全速运行的时候,大家拼的除了架构(IPC),还有睿频加速频率。举例来说,2690架构是老了,但是能持续加速到3.8GHz,多出来的200MHz使之基本和2600 v3处于同一档次。

7

  解压缩方面其实在倒退。2690胜在高频率和低延迟,2600 v3则因为三级缓存、内存延迟相对较高而落败。当然,这也证明Intel的睿频加速技术是很成功的,即便是在18核心和超大容量三级缓存的型号上,对同样大有裨益。

8

  真正体现18核心威力的时候终于到了!除了节能版之外,性能基本与核心数量成正比,18核心2699 v3已经是8核心2690的整整两倍!Opteron 6376纯粹是打酱油的,空有所谓16个核心,但严格来说只是8模块而已,连人家的8核心或者节能版12核心都远远不如,2690都能完虐之。

9

10

 


3单、多线程性能测试回顶部


应用性能测试

  Linux内核编译:内核编译器对超多核心的支持一般并不好,但是18核心2699 v3仍然明显领先于14核心的小弟。Haswell架构对整数核心的改进也起到了重要作用,8核心的2667 v3都足以干掉12核心的2697 v2。值得一提的是,前者无法在开启所有核心时进行睿频加速。相比于SNB-EP,性能在差不多的频率下更是提升了50%。

11

  SAP S&D:18核心及其45MB三级缓存再次称霸,尤其是三级缓存容量对该项目很关键。

12

  Java:2695 v3都能干掉2697 v2,而二者功耗差不多,前者频率更低,性能领先13%后者持平。

13

14

  Web性能:2600 v3全面领先,但是14/18核心的好处并不大,尤其是后者几乎没带来什么额外提升,原因不在处理器,而在测试程序不足:一是当前测试网站数据库太小,二是还需要进一步调整网站以适应更多核心。

15

  OpenFoam高性能计算:因为是AVX代码,单线程性能完全看频率,多线程下18核心就只能仰视了,不过频率仍然重要,2667 v3就因此追平了2695 v3。

17

16

 


4应用性能测试回顶部


功耗、能耗比测试

  待机功耗:2600 v3系列标准版都在100W左右,尤其是18核心的2699 v3,如此大的芯片竟然可以控制得如此之好,而且别忘了工艺和上代同为22nm,并没有变。32nm 2690就不说了,核心最少,功耗最高。

18

  100ms响应功耗:2600 v3系列尽管性能强悍很多,代价也不菲,功耗非常突出。

19

  Web能耗比:2695 v3凭借足够多的核心、足够高的加速频率,再次赢得掌声,能效很高。18核心的因为耗能太多,效率反而下来了。2650L v3作为节能版确实名副其实,12核心65W还是很不错的。

20

  高性能计算功耗:2699 v3电老虎再次发威,峰值功耗比待机时高了几乎450W!如果风扇算100W,那么每路单颗处理器就是175W,即便这样的测量并不精确,还包括供电功耗,但仍然相当相当耗电。

21

  高性能计算总能耗:低功耗版的2650L v3又赢了,而且赢得很轻松。18核心虽然耗电大,但毕竟性能也摆在那里,完成任务所需要的能量并不是很多。32nm SNB-EP 2690彻底老了。

22


5功耗、能耗比测试回顶部


小结

  经过了众多的项目的测试可以看出,根据不同的环境和应用,赢家也完全不同。多核心、高频率的区分也不再那么泾渭分明,例如内核编译测试通常喜欢高频率,但是18/14核心表现也不差,因为睿频技术越来越成熟了,完全可以弥补原始主频偏低的劣势。

  从测试结果来看,E5-2695 v3的核心、频率和功耗都比较均衡,但性能很出色,在几乎每个整数应用里都能处于领先地位。E5-2650L v3是名副其实的节能版,同时性能也不差。而E5-2699 v3就是个超级电老虎了,高达145W的TDP甚至比以前的旗舰更耗电。至于AMD方面,只希望其所谓的全新架构能够重振雄风,不重蹈推土机的覆辙。

201
正面

202
背面

阅读(1430) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~