Chinaunix首页 | 论坛 | 博客
  • 博客访问: 846968
  • 博文数量: 180
  • 博客积分: 10029
  • 博客等级: 上将
  • 技术积分: 2185
  • 用 户 组: 普通用户
  • 注册时间: 2009-11-06 09:15
文章存档

2010年(133)

2009年(47)

我的朋友

分类: 系统运维

2010-05-01 13:06:34

   网格(grid)是20世纪90年代中期发展起来的一项技术,其标志性应用为全球范围内的大规模科学计算(E-science)[1]。它将位于不同地理位置的科学仪器、高性能计算机、分布式数据库、传感器、远程设备等组合起来,以解决复杂的科学问题,如全球气候模拟、高能物理、基因图谱的测绘、核试验模拟、新药的研制、虚拟专家会诊、大规模信息和决策支持系统等。网格技术使人们能够共享计算资源、存储资源和相关服务,因此它在天文、航空航天、交通、制造、气象、钢铁生成、核反应堆等诸多领域的科研计划和产业发展中起着至关重要的作用。

  在网格应用中,传感器、远程设备、高性能计算机及可视化设备之间需要实时传送terabyte甚至petabyte量级的海量数据,网络在网格应用中占有十分重要的地位。传统无法提供低延时保证下海量数据的高速传输,同时其尽力而为的服务方式无法满足用户的QoS要求。因此,构建在传统互联网上的网格应用存在着诸多的局限性,如数据传输速度慢、可靠性差、用户交互性差、使用界面不够友善等,极大地影响了应用系统的效率。

  光子网格(opticalgrid)是近年来在上述背景下发展起来的一种新兴技术[2~3]。其基本思想是将分布在不同地理位置的高性能并行计算机、计算机集群、大型存储设备、高清晰显示设备、大型科学仪器以及各种类型的个人计算机、服务器等通过光网络相互关联起来。由于光网络具有大带宽、高度透明、低延时、低成本、高可靠性和动态带宽调整能力,因此光子网格在满足用户共享网格信息资源的同时,还可为网格应用提供海量数据的快速传输、高可靠性管理及资源的灵活调度和控制。

  光子网格网络的实施,可突破网格应用中的网络瓶颈问题,使网格用户能够与高端计算资源保持同步并维持令人满意的互动功能,从而加速应用领域的科研进程,促进相关产业的发展。另一方面,光子网格的实施,使得高性能计算资源、存储资源及科学仪器的拥有者能够更有效地拓展应用市场,提高资源的利用率。由此可见,光子网格是使网格应用真正走向实用的可行技术。

  2 光子网格产生的背景

  近年来,随着大规模科学计算应用的不断发展,其对计算机处理能力、存储能力及高性能可视化的要求在不断增加。计算机处理或存储能力受技术及成本等因素的制约,为每个用户配备高性能计算、存储及可视化设备既不经济也不现实。一种可行的解决方法是将计算及存储任务分配给不同的计算机,通过共享不同研究机构的计算、存储及可视化资源来实现大规模科学计算及可视化应用。这种方法可以有效地节省成本,提高资源的利用率。

  与此同时,当今科学计算问题的复杂性在不断增加,它需要不同领域、不同国家的科学家共同协作才能取得突破性的成果。因此,必须构建一个高速网络将这些科学研究工作者、高性能计算及存储设备、高精密仪器及可视化设备关联起来,实现不同地理位置之间海量数据的高效传送。上述应用导致了对网络的连通性及带宽要求的不断增加。

  光纤及光网络传输设备的大范围敷设及广泛应用为互联高性能计算机、大型存储设备、高清晰显示设备及大型科学仪器提供了可能。目前,在10Gbit/s及更高速率上,与IP交换机相比,光交换机具有更低的功耗和成本。光网络可以提供低成本、高带宽、高可靠性光连接,已被绝大多数研究机构甚至一些个人用户所接受。

  光子网格即是在上述背景下产生的,它通过光网络将终端用户、计算、存储等资源关联起来,从而实现远程海量数据的高速传输。

  3光子网格研究的关键问题

  光子网格不等于简单地用光网络来提供大数据传输。要有效地支持网格应用,传统的光通信网络及网格技术面临着一系列的挑战。

  首先,要支持网格应用,需要为大量的用户和终端设备提供从Mbit/s至Tbit/s量级的传输带宽。用户对带宽的请求具有突发性、并行性、大规模、多种粒度并存的特点,而光网络的带宽资源及网格的计算与存储资源均是有限的。很显然,为每个用户任务提供专用的光通路既不经济也不现实。因此,光通信系统需要支持不同类型、多粒度、突发性带宽需求,具有按需分配带宽的能力;提供组播和广播能力;同时,系统为满足应用需求,还需要为用户或应用提供自组织、自管理和自控制分布式网络资源的能力,支持灵活、快速的通道建立。

  其次,网格应用不同于通信网络上的点到点通信业务,它具有分布式、多任务流的工作特点,多个任务可以分配至不同的计算资源上并行运行,不同的任务分配方式会导致不同的光网络资源分配方式。即使计算资源分配方案是确定的,由于光通道源、宿节点对之间可以有不同的路由选择,因此光网络资源将有不同的调度方案。而不同的任务分配方法又会导致不同的任务完成时间。因此,要在给定的限制条件下高效地完成一个给定的业务,系统必须支持大规模的分布式并行网络服务,必须合理地描述各业务流程之间的相互关系,并通过一种全新的方式来协同调度计算资源及光网络资源,否则将直接导致系统运行效率及资源利用率的降低。

  再者,目前网格计算在完成资源发现、任务调度的过程中,通常不考虑网络资源的限制及可用性,并且缺少从网络中获取可用的网络资源信息的发现机制。而在实际应用中,网络资源是一个影响系统效率和应用功效的重要因素。因此,必须寻找一种新的资源描述、资源发现及资源更新机制,以实现对计算资源和网络资源的统一管理和合理利用。

  最后,网格应用的多业务流、大数据量特性要求通信网络具有更高的安全性及数据正确性保证。虽然网格具有一定的容错机制,网络也具有一定的保护/恢复能力,但是如何根据用户的QoS需求,通过光网络和网格的协同操作来实现更高级别的系统容错,以保证网络的安全性及网格用户与通信网络接口的安全性,也是需要解决的问题。

  针对上述关键问题,国内外研究机构及相关学者就光子网格及其应用重点从以下几个方面开展了研究。

  ·光子网格体系结构及实现技术:重点研究建造光子网格的技术、光子网格的基本组成与功能、光子网格各组成部分的相互关系、各部分集成的方式或方法以及它们与网格应用之间的相互关系。

  ·控制与管理协议:重点研究光子网格的控制及管理机制,包括用户网络接口、计算资源调用及控制机制、光网络突发带宽的动态调用及调整、信令和路由协议、域间和层间控制协议、光子网格中间件的接口技术及实现方法等。

  ·光子网格资源发现及调度机制:重点研究光子网格环境下网格信息资源和光网络资源的描述、注册、发布、更新、服务部署、资源发现和资源调度机制,并在此基础上研究不同工作模式下网格信息资源与光网络资源的协同优化调度机制、实现算法及性能指标分析。

  ·光子网格容错及安全访问机制:重点研究光子网格权限管理机制、用户身份认证技术以及跨域调度的安全和权限管理技术,研究在光子网格发生光纤链路中断、设备节点故障、服务器宕机或服务程序中断情况下,如何设立不同等级的容错策略,在保障数据传输的准确性和及时性的同时,使用户察觉不到系统故障,以满足不同用户的QoS要求。

阅读(1786) | 评论(0) | 转发(0) |
0

上一篇:上海救了世博?!

下一篇:cygwin安装问题

给主人留下些什么吧!~~