Chinaunix首页 | 论坛 | 博客
  • 博客访问: 807923
  • 博文数量: 850
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 9960
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-04 11:03
文章分类

全部博文(850)

文章存档

2011年(1)

2008年(849)

我的朋友

分类: 服务器与存储

2008-07-05 21:46:28

一.行业背景及用户需求分析

地学数据存储系统,既有常规数据中心中存储设备共有特性,又有其独特的地方。分析处理、解释、油藏等地学应用不难发现,除了高度可靠性、高性能、灵活方便的在线扩容等要求外,还有如下的典型特征:

•完整的地学IT架构,应该面向多种地学应用系统,以较好的满足他们不同的需求。对处理系统来说,传统上服务器大都是SMP并行机系统,对MFLOPS有着严格的要求,对用户来说可能正在使用 SP系列服务器;也可能SGI ORIGIN高端服务器正在担任着繁重的处理任务;出于性价比的考虑,越来越多的用户开始转向采用PC LINUX集群来提供强大的处理能力,所以不同时代的处理服务器,应该能够共享地震工区数据,尽量减少数据传输甚至是格式转换这一繁重的工作。

•今后随着新解释工具(5X),预存储数据解释工具(5X),慢速(4D)地震(3X)以及剪切波数据的运用,数据量将会以惊人的225倍(5533)的高速度增长,因此存储系统应完全满足未来应用对容量的要求,同时具备在线增容的能力。

•对地震道解释系统来说,高级的解释系统大都采用高端SGI工作站来满足图形方面的苛刻要求,而普通解释工作则可以在HP、SUN、IBM的工作站上进行,单工区解释可能会有多个技术人员参与,因此存储设备应该具备异构平台、多用户数据共享的能力。

•随着现场处理技术和WINTEL技术的发展,无论是处理还是解释等其他的应用都开始支持UNIX和WINDOWS两种版本,因此同时支持CIFS协议和NFS协议成为存储设备数据共享不可或缺的指标。

•对三维地震数据来说,无论是处理解释,还是虚拟现实应用系统,都面临一次性加载大数据体的工作,加上应用系统的中间结果,大容量文件系统和大尺寸单个文件的存储设备是高效完成生产任务的可靠保证。

•处理解释一体化IT架构,减少迭后数据传输量,密切处理解释人员的合作,优化整个地震数据的处理流程,提高生产效率,最大化地震数据的利用率。

•有效的磁盘到磁盘处理,缩短生产周期,提升竞争力。

正是基于上述考虑,针对标书要求,我们提出如下解决方案。

二.地学数据存储系统解决方案

1.方案设计原则

充分满足标书对存储设备性能、功能的要求。

选用业界领先的技术和产品,保证方案的先进性;充分考虑与原有设备的兼容性和互操作能力,最大程度保护用户投资。

与地学应用系统的成熟结合能力。

存储系统设计完全基于现有计算机和网络设备业界的开放标准,适应用户现有网络系统硬件环境要求。

数据的安全性和系统的高可靠性,存储系统负责存储整个中心的数据,是典型的关键业务,是不能停止的,对系统的高可靠性有着较高的要求。作为该系统核心的存储平台的高可靠性则更是重中之重。由于采用了集中存储的方案,所有的相关数据均集中存储于统一的平台之上,存储平台的任何故障会造成大的影响。因此存储平台的数据安全性和系统高可靠性尤为重要。

系统的高性能,存储系统要为大量的用户存储数据。由于总的数据量会达到TB级,如何在这么大数据量情况下满足多个客户机的并发访问,整个存储系统的性能也是一个非常关键的要求。而且考虑到将来业务的增长,数据量还会持续增加,客户机的数量也会继续增加,系统的性能还应能很好的适应未来的扩充和扩展的需要。

系统的可扩展性/可扩充性,作为集中存储的基本要求,存储系统应能支持巨大的存储容量,可以集中存储不同平台的企业数据,从而在保留分布式处理好处的同时实现核心信息的

集中存储和集中管理,随着时间的推移、技术的发展以及环境的变化,用户的数据量会飞速增长,许多新的用户或新的需求会不断产生,因此对存储系统的可扩展性有很高要求。尽管我们在本方案中已经充分考虑了系统存储容量空间的预留,但随着业务的发展,对存储系统的可扩展性要求仍将非常迫切。这主要表现在对存储系统容量的平滑扩充以及对新的主机(HOST)系统的平滑连接,以尽量减少对已有正常业务的影响。

数据共享及系统的多平台支持能力,作为集中存储的基本要求,存储系统必须能够同时连接不同的平台,以满足未来数据集中、共享的需要。

灵活性和系统管理的简单性,由于存储系统的数据量非常大,如何有效的管理大量的数据,包括数据备份/恢复,都对存储系统的管理提出了巨大的挑战。系统管理人员需要有高效的方法实现全面的存储系统监控,包括实时数据性能监视、错误监测、错误状态识别等等。另外作为集中的存储平台,由于前端需要连接的服务器数量很多,如何在多个服务器平台之间对容量进行灵活的划分和调度也是为存储系统的管理提出了巨大的挑战。

从标书整体要求出发,充分考虑用户对备份系统的要求,利用成熟可靠的Lan Free 备份技术,实现大数据量的高速备份,减轻系统管理人员的负担,保证处理员和解释员即使在备份时也能正常工作。

2.方案拓扑结构

为了充分满足标书要求,我们选择NetApp FAS920c作为集中的存储设备。如下图所示:

3.FAS920C配置

FAS920C配8条千兆以太网连接,可以做成两个捆绑,分别对应处理VLAN和解释VLAN。

NETAPP存储设备硬件有着简单的架构和满足工业标准的组成部分。简化了维护和管理,并确保采用最新工业技术简单升级。NetApp存储设备由两个主要部分组成: 机头和磁盘包。

机头

本方案采用双机头配置,可以被安装在19”机架上,双机头工作在ACTIVE/ACTIVE模式下,可以保证正常状态下的高效率,又可实现故障状态下的自动切换,主要功能是运行NetApp存储操作系统,是整个存储设备的核心部件。

磁盘包

磁盘包和机头一样,也可安装在19”机架上,由下述部分组成:

1.(热插拔)。

2.14个/18/36/72/144/300GB磁盘(热插拔)。

3.双ESH2或ESH4(失效自动切换)。

4.控制单元(监控和诊断)。

5.多个磁盘包可以连接在一个机头上,容量从表面上1TB到64TB。可以在线增加磁盘包。

裸容量为6TB。

1.单盘容量: 144GB

2.磁盘数量: 44

3.RAID组包含盘的数量: 8

4.快照预留空间: 0

5.数据盘数量: 37

6.校验盘数量: 6

7.热备盘数量: 1

8.裸空间: 6.34TB

9.WAFL占用空间: 0.5TB

10.可用空间: 4.53TB

容量计算:

容量的计算公式是:

需求盘的数量=(客户需求的有效数据量)/(格式化后的磁盘空间)+(校验盘的数量)+热备盘

空间利用率的公式为:

空间利用率 =(数据盘数量×格式化后的容量)/ (总需求盘的数量×每块盘的裸容量)

下面根据用户需求配置出FAS920c所需的实际磁盘数、裸盘容量及有效容量。

FAS920C的软件配置如下:

DATA ONTAP最新版本/SnapShot/RAID DP

Cluster Failover支持软件

iSCSI支持软件
SnapDrive for Windows(如果应用IP SAN)

CIFS支持软件

NFS支持软件

SnapRestore软件

4.安装、配置、管理

安装:

由厂家或合格的代理商工程师现场安装。

首先检查用户场地,满足要求后加载NetApp软件,通过超级终端完成FAS920C的基本配置。

与用户交换机连接,分别定义处理服务器和解释及虚拟现时服务器的以太网通道及相关IP地址,对应不同VLAN,NetApp存储设备缺省支持两种方式的捆绑:SINGLE MODE和MULTI MODE,SINGLE MODE对用户交换机没有特殊要求,MULTI MODE需要交换机支持CISCO ETHERCHANNEL技术。

根据用户对可靠性要求的不同,设定热漂盘数量,以及是否采用RAID DP技术。

配置:

阅读(431) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~