Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11675847
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-12-31 08:40:35

   计算机是这样一个严谨而又有趣的世界,一方面,它有严密的理论依据,在满足客户需求方面容不得半点虚假;另一方面,必须对不同层次的用户提供尽可能亲切的接口。无论是主机、存储,还是,都无一例外的能看到这样的现象。这成为衡量一个计算机系统的重要指标。

    而随着这个世界信息化程度的不断提高,我们对计算机系统的要求也与日俱增。

    那么信息化会发展到什么程度呢?根据IDC的统计,从现在至2011年,数据会以每年百分之六十的速度增长,仅在2007年就产生了281 EB (Exabytes) 数据。当我们面对这样巨大的数据增长,我们不禁会问,我们在技术上准备好了没有?

    要回答这个问题,我们要分别分析计算,通讯,存储三个领域是不是准备好了?

    我们先从计算领域入手。计算领域的核心技术是CPU,该领域在最近几年取得了很大的突破,多核技术、直连架构使得原本在高端上才使用的对称多处理技术延伸到了普通,上,甚至的CPU也是多核的。多核技术也同时带动了多任务多线程的的发展。根据厂商的路线图,我们可以看到未来几年多核并行技术会有进一步的发展,满足我们对海量信息处理的需求。计算领域显然是在走向通过并行技术来提高性能的方向。

    既然探讨计算,就不可避免要谈论系统,在操作系统上层,最重要的应用就是数据库应用了,让企业感到有信心的是,数据库技术也在走向一个可以高度自动伸展的方向,你可以使用一套数据库来满足从手机到大型机的应用,你可以从主流的SQL Server,Oracle, MySQL等数据库软件很明显的体会到这一点。

    在网络方面,网格技术使得我们可以大量部署廉价计算机,通过并行的工作方式来实现很高的性能,一个最典型的例子就是Google的云计算。Google的成功也使得网格计算成为一种成熟可靠的网络计算方式。

    由此看来主机和网络都已经准备好了。

    最后,也是最重要的一环,存储技术! 它的重要性不言而喻。既要满足用户对容量的巨大需求,还要提供足够的IO带宽,同时要更方便管理。存储从主机内置(直联技术)发展到集中式的SAN (Storage Area Network) 网络存储模式,是一个巨大的进步,但是随着我们新一代动态应用要求的不断提高,现行的SAN还能否满足我们的需求呢,会有新的发展方向吗?或需要退回到主机内置模式呢?未来的SAN技术到底何去何从呢?

    在展望SAN的发展趋势之前,让我们仔细探讨SAN带给我们的喜悦和困扰。

    SAN自从80年代产生以来,推动着存储技术不断前进。SAN首先带给我们大容量高性能的存储,能够适用于从小型服务器到大型主机的应用需求。SAN更重要的核心特点就是存储的大整合, SAN可以灵活的分配存储资源给用户,SAN的通讯协议FCP则提供了可靠和高速的连接技术。通过不断的完善,SAN能够提供全面的存储解决方案,能够适应从中小企业到大规模数据中心的发展需求,能够满足容量和性能的要求,从近二十年的使用来看,SAN是相当稳定和可靠的技术,大量的用户群可以有力的证明SAN技术。不仅如此,SAN仍然在不断的发展,从最初的1Gb带宽,到最近的8Gb,网络带宽在不断地提高,看似存储的问题可以一劳永逸地解决了。

    但是埋藏在SAN体内的先天隐忧,使得现行的SAN在面对人类史无前例的海量数据面前,日渐力不从心,根本的原因还在于它的基础框架的结构,我们都知道,主机就如同一个大大的框框,把存储资源限制在使用的范围,形成一个又一个的小孤岛,SAN的出现打破了存储固定于主机的限制,集中化的存储可以属于很多主机,看似孤岛消除了,但是实际上是形成了更大的孤岛,同时还要面对,随着数据量的增加,访问用户量的增长,构成SAN的每个存储的处理能力却没有随之增大,造成前端的带宽虽然增加了,但是由于处理器的瓶颈,IOPS并没有相应增加。由此导致一个可预见的问题产生了,购买的SAN的时候,要对未来的增长有一个很好的规划。

    由于当前SAN是基于硬性框架的,所以对于容错,负载均衡等跨越框架的需求,就变得异端困难,需要借助复杂的软件系统和复杂的操作,如果说针对目前的数据量,我们对于SAN的复杂性还能够接受的话,那么对于即将到来的海量数据时代,SAN将变得极端复杂,以至于难以为继。

    简单来说,问题的实质就是SAN仍然是以磁盘配置为中心,但是应用主控权却是落在主机上,一旦后端的存储控制器绑定,这种静态绑定将很难灵活更改,所以我们可以把现行的固态表现SAN称为SAN 1.0,它具备典型的是刚性系统的特点,即硬度有余,弹性不足。

    上面我们从SAN存储架构的角度探讨了SAN的优点和困扰,下面我们从硬件到软件层的角度进一步探讨。

    现在的IO系统一般是划分为这样的层次,应用程序层,文件系统层,操作系统层,虚拟主机层和网络通信层,而这些软件层,都是建立在存储硬件层之上,而硬件层一般分为存储HBA层,逻辑LUN,硬盘。在这些层中,每一层都有独立的其它层不可干预的管理机制,比如说缓冲,不同层的缓冲有不同的划分方式,缓存片,缓存块,缓存叶,数据要从应用程序最终写入到硬盘,要经过的每一层都要做很多的转换工作,这是的存储系统的优化工作非常难做,因为要同时考虑多层的不同机制,在应用中,我们不得不配置大量不同的LUN来适应不同的应用,这是的数据孤岛问题更加严重,使得SAN的存储整合的目的大打折扣。导致的另外一个问题就是,如果需要对存储资源进行调整,往往需要停机来实施。

    在当前的存储应用中需要面对的一个新问题就是如何应对前端的主机虚拟化要求。主机虚拟化之后,虚拟主机会根据用户需求和资源环境在资源池里处理在线的动态资源飘移,而在SAN 1.0技术中,后端的硬盘和IO路径配置却是静态绑定体系结构的,所以这种前柔后实的框架结构限制了虚拟化的动态特性,最后将导致IO失去平衡,延伸出性能瓶颈问题。

    在我们探讨SAN 1.0存在的这些困扰我们使用的地方时,您可能会认为,会不会是光纤通道协议本身导致了这些问题,如果我使用iSI协议是否就可以避免这些问题,答案显然是否定的,因为底层的固态结构决定了无论上层讲什么样的语言都会存在相同的困扰。所以说,导致问题的根源不在于协议,而是由于SAN 1.0技术的先天不足。

    SAN既给我们带来巨大的技术优势,同时也带来了很大的困境,一方面它具备强大的数部保护能力,但如果实施这些数据保护技术将会导致性能的牺牲;一方面具备很快地恢复能力,但又不得不停下应用才能够实施;一方面提供了很多高级的应用技术,但又需要有高水平的管理员;一方面提供了高容量存储,但由于主机和硬盘邦定,所以为满足未来的需求,只能在规划阶段尽可能扩大需求,避免未来扩容的不便。一句话,用户要求无法得到平衡, 被迫二选一!伤害的总是企业的敏捷性和业务持续能力 。

    这个时候,我们可能会感到一丝的担忧,难道通向信息化的道路上的这个堡垒会一直阻碍我们前进吗?确实,SAN领域已经很多年没有出现让我们兴奋的技术了。

    在解决问题之前,我们先了解其它领域发生的事情。

    早在80年代, Token Ring,FDDI,和Ethernet就进行了一场基础网络的战争,最终的胜利者是Ethernet。在网络协议领域,也同样进行着另一场战争,交战的几方是IPX/SPX,TCP/IP和OSI的舞台,结果是TCP/IP站在了最后。

    差不多在同一时代,在基础网络之上,还进行着一场应用网络的战争,分别是存储方面的FC,基础网络的Ethernet和服务主机间的高速通讯InfiniBand。这场战争在2007年有了一个清晰的解决,FC推出FCoE (E=Ethernet) 作为下一代的FC技术标准,这也意味着下一代的FC光纤会采用以太网的技术。InfiniBand组织也推出了面向Ethernet的版本。这也就意味着在应用网络领域,大家都会走向统一的以太网,我们称为Unified Fabric。以太网技术再一次赢得每个人的最后掌声!

    在IT系统之外,我们也可以从生活中的实际例子看到类似的趋势。

    对于中国铁路系统的动车组这样一个概念已经不陌生了,您知道动车组是怎样达到这样高的速度吗?是不是开发了史无前例的强大动力的发动机,并向现在的火车那样,把它装在最前面,以此牵引后面的车箱快速前进呢?恰恰不是如此,动车组使用了更灵活,更智能化的方式,把动力装置分散安装在每节车厢上,使其既具有牵引力,又可以载客,这样的客车车辆便叫做动车。动车组就是几节自带动力的车辆加几节不带动力的车辆编成一组。这多么像我们计算机系统的并行运算的概念啊!

    如果说使用并行工作的方式指示解决了性能问题,还有一座大山等待我们去征服,那就是如何自动化操作。像刚才的例子,我们也从生活中的真实案例去寻找灵感。

    您还记得在七八十年代的电话系统吧,那个年代没有程控,所有的线路连接都需要人工完成,接线员要熟记一部电话号码本,才能胜任工作。就像SAN 1.0中需要配置各种路径、存储单元、主机绑定那样,需要绝对依赖管理员的操作。自从程控交换技术发明以来,实现了彻底的自动化,既避免了人为错误,也大幅度的提高了速度。

    我们再回到IT,参考IDC发布的未来五年虚拟化技术发展趋势的四大阶层路线图。从最初的虚拟化1.0,以实现资源整合为目标,到虚拟化2.0以减少宕机时间为目标,现在进入到虚拟化2.5以提高动态负载均衡和减少意外宕机为目标,未来的虚拟化3.0则是以实现IT基础设施的彻底的自动化为目标。

    根据上面的诸多领域的实际案例里,我们可以总结出什么样的技术才是SAN 2.0。

    首先,必须以Unified Fabric作为存储网络基础;基于对等技术的并行工作机制,采用对等存储结构,网络和存储具有相等的控制权,可相互动态调配多IO引擎;高灵活性,自我学习来提高适应性;导入虚拟化技术来达至自我优化效果。如果我们用一个实物比较SAN 1.0和SAN 2.0,SAN 1.0就像是早期的运载车,非常强调容量,而SAN 2.0相当于最新的跑车,采用了类似于四轮--并行工作,ABS(车轮自动锁盘系统)的自动懂得自我保护数据措施,新车的自动巡航模式--性能懂得如何自我调优,兼顾了容量和自适应的性能,使得系统永远在线和绝对的灵活性。

    我们说了这么多有关SAN 2.0的最新趋势,那么产品和方案在哪里呢?

    时光进入到2008年,我们看到了这样的曙光,根据最新的Gartner市场调查数据,戴尔成为开放式外置存储的第一名,戴尔已经取得存储市场的领导地位。

    在2008年,戴尔在存储市场保持了强大的投资,首先以存储市场的领导地位引领存储进入SAN2.0;以成熟开放的Ethernet技术推进Unified Fabric目标,把SAN2.0作为简化IT战略的重要一环;收购EqualLogic对等存储技术配合SAN2.0理念;除了产品以外,提供全面虚拟化技术为客户提供完整的解决方案。

    当我们面对这个的海量数据时代,我们会自信地说,我们准备好了。

阅读(1754) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~