Chinaunix首页 | 论坛 | 博客
  • 博客访问: 346087
  • 博文数量: 60
  • 博客积分: 1443
  • 博客等级: 上尉
  • 技术积分: 780
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-28 16:16
文章分类
文章存档

2018年(2)

2015年(1)

2012年(1)

2011年(6)

2010年(9)

2009年(41)

我的朋友

分类:

2009-07-15 10:49:30

    在英特尔和AMD的争斗中,AMD一直能够自豪的宣称其处理器具有更为先进的结构。无论是64位还是多核心,AMD也的确在产品发布速度以及产品架构上有所领先。在先后发布了“巴塞罗那”“上海”两代处理器之后,英特尔也终于推出了与之争斗的产品—Nehalem,也就是Xeon 5500系列产品。每一代Xeon处理器都会有架构相同的桌面级产品与之对应,在去年11月发布的i7系列处理器在很多地方都与Nehalem相同,但是台式机和服务器不同的定位也决定了两者同样有诸多不同之处。

    Nehalem同样也是采用54nm制造工艺,这与以往的Xeon 5400是完全相同的。按照我们以往的测试经验,在处理器制造工艺没有提升的前提下,更复杂的架构、更多的晶体管数、更高的性能就意味着更大的功耗。在绿色环保概念盛行的今天,如果一款处理器即便拥有再高的性能,而在功耗控制上一无是处,它也会倍受攻击而逐步堕入深渊。令人欣慰的是,英特尔并没有重复Pentium 4上所犯的错误,在Nehalem上我们看到了诸多技术用于处理器的电源、功耗控制。通过我们的测试证明,Nehalem在提供更为强劲性能的同时,也成为Xeon系列处理器中对功耗控制做的最为出色的一款。

   Nehalem是英特尔第一款采用直连架构以及内置内存控制器的产品。作为网络服务器的提供者,服务器通常都会面临高负载下的多任务运算,而采用直连架构以及内置内存控制器则是有效提高处理器运行效率的手段。如果有人说英特尔不过是在跟随AMD脚步也没什么,对于用户来说所关心的无非是产品的实际使用效果而不是所谓的技术领先。在英特尔的产品说明中将处理器分为了Core以及Uncore两部分,Core顾名思义就是表示处理器核心,而Uncore部分则包括了L3缓存、QPI、IMC以及电源控制器。Nehalem支持DDR3内存,而内置内存控制器的结构也消除了处理器与内存之间的瓶颈。为了满足不同应用环境的需求,Nehalem可以支持DDR3 800、1066以及1333规格内存,而每个处理器则都有3个内存通道。关于Nehalem QPI、内存控制器等部分的详细介绍,请参看《个人电脑》2008年第11期,或者我们的网站。

   架构的变化除了给Nehalem带来性能提升外,对服务器的结构设计也更为灵活。英特尔对应Nehalem的服务器芯片组是Tylersburg系列芯片组,其中包括Tylersburg-36D和Tylersburg-24D以及Tylersburg-36S和Tylersburg-24S。它们在结构上没有太大差异,主要区别是在于QPI以及PCI Express的通道数目上。我们在服务器平台上看到的将更多是支持2个QPI通道以及36或24个PCI Express通道的Tylersburg-36D和Tylersburg-24D。

 性能,更要节能:Xeon能耗比新星


   如果是四路服务器平台,那么直连架构给服务器带来的性能提升将会更为明显。由于每个处理器都是拥有自己的内存控制器,这样就避免了以往多处理器竞争内存带宽的情况,而且像下图中所显示的那样,这种交叉连接方式将使数据直接在处理器之间进行交互。

   通常情况下服务器都是采用一套芯片组来支持多个处理器,对于Nehalem平台来说,由于直连架构以及QPI的采用,厂商可以根据用户的需求来提供更为灵活的设计,比如为了满足对PCI Express扩展的需求,可以采用两个Tylersburg-36D提供高达78个PCI Express通道(6个2.5GHz Gen 1, 72个5GHz Gen 2)。

Nehalem的功耗控制
   在众多新技术、架构的支持下,我们丝毫不怀疑Nehalem的性能表现。对于一款采用了23亿个晶体管、45nm制造工艺,并且内置内存控制器的处理器,我们对Nehalem在实际应用中的功耗控制更为感兴趣。英特尔送测样机采用了两颗Xeon 5570处理器以及24GB内存,按照我们以往的经验,这样一台服务器的空载功耗就要超过200W,而实际测试却证明了这台服务器在空载待机时的功耗只有175W,而我们的Xeon 5472服务器的待机功耗则达到了310W,两者之间的差距令人吃惊。



 

 Nehalem是英特尔第一款采用直连架构的处理器

 

 对于四路服务器,Nehalem的这种交叉连接方式更为实用。

 

 整个处理器可以分为Core和Uncore两部分

 

 Tylersburg-36D可以提供36个PCI Express通道

 

 如果需要更多的PCI Express,可以通过双芯片来实现最多78个PCI Express通道。

 

 PCU是Nehalem中最有特点的组成单元

 

 Power Gate可以控制每个核心在独立的电压/时钟频率下工作

 

 在Tylersburg-36的芯片组中,也同样设置了一个管理引擎来提供对智能功耗控制的支持。

 

 Turbo Mode通过改变核心工作状态来提升程序的应用效率


在Nehalem处理器中,采用了一个独立单元PCU(Power Control Unit)对处理器的负载率、温度等信息进行监控,而包括Power Gate这些技术,则实现了对处理器内每个核心的状态控制。Nehalem可以根据应用程序的需求来开/关处理器的单个核心,而且可以控制每个核心在独立的电压/时钟频率下工作。在处理器的负载非常低的时候,Nehalem甚至可以允许单个处于闲置状态的核心(idle Core)的功耗降到接近0W,并且实现了超低漏电量以减少不必要的功耗损失。

 性能,更要节能:Xeon能耗比新星


在我们以往所测试过的服务器产品中,服务器的功耗表现基本只有两种,待机、满载。由于应用程序的不同,服务器在满载时候的功耗的确会略有差异,这主要是由于磁盘访问而引起的,但是不会像Nehalem那样随着系统负载的变化而出现功耗的大幅波动。Nehalem的处理器工作状态可以有15个级别,这就意味着它可以在PCU的控制下随时调整处理器的频率以及电压。只要系统的负载有所下降或者上升,Nehalem就能实时的进行调整来同时满足性能、功耗控制双方面的需求。在测试中通过控制系统的负载量,我们也明显发现Nehalem服务器的功耗有着较大的变化。除了Nehalem处理器具有很好的功耗控制外,与之对应的Tylersburg-EP芯片组在功耗上也比较低。Tylersburg-36D的设计TDP是27W, ICH9为4.3W,而Tylersburg-36D的空载功耗则只有8W。

Turbo Mode
Nehalem对处理器内每个核心的状态控制这一特性,除了可以提供更好的功耗控制,另外也实现了对处理器的性能提升。熟悉汽车的读者都会知道涡轮增压技术(Turbo),借助该技术,我们可以在较小排量的发动机上实现更大的功率、扭矩输出,而英特尔也为Nehalem提供了类似的技术匹配—Turbo Mode。在图中可以比较明显的看出,Turbo Mode很像是英特尔的官方超频设置。处理器会根据应用的需求关闭一些不需要的核心,而将部分核心的频率进行提升以满足应用程序的需求。与Hyper Threading不同的是,Turbo Mode提供的是实打实的频率提升,而不是像Hyper Threading那样只是改善运行效率。不过可以放心的是,Turbo Mode会在Nehalem规定的TDP下运行,不会对处理器的散热造成任何麻烦,这比我们自己DIY时候的超频要安全的多。如果你真的不放心,也可以在服务器的BIOS中将Turbo Mode关闭。

 

阅读(593) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~