研究员Mostafa Ronaghi是一位有名的生物工艺学专家,他在DNA测序方面获得了多项专利证书,并且研究出一种名为Pyrosequencing(焦磷酸定序)的技术,利用这种技术方法可以对人类基因组进行测序。然而说到数据存储,Ronaghi却不是专家了。
Ronaghi谈到他们SGTC研究小组时说:“我们是生物学家,对存储软件知之甚少,在遇到有关存储技术的难题时就变得非常急躁。”
所以当Ronaghi在为SGTC小组的DNA Pyrosequencing Machine产生的大量数据文件寻求一种安全的存储和复制方法时,他向厂商明确表示所选方案必须是易用、易扩展、存储数据易读取的。
超高像素图像(Ultra-hi-res)存储
对Ronaghi来说,超高像素图像存储解决方案应该是将原始容量为60GB到70GB之间的数据进行处理,之后以33MB到160MB左右的容量进行存储。这些非常珍贵的图像数据资料需要被妥善地保存并且至少保留一个备份,确保信息信息在设备发生故障的时候可以安全保存下来,使Ronaghi和他的研究小组可以在与其他科研机构的合作者共享数据资源。
此前SGTC正在使用一种归档系统来存储他数据密集文件和超高像素图像数据。Ronaghi表示:“但是搜索这些数据是一个令人头疼的问题。”当他们想要读取这些数据文件的时候系统速度就变得非常慢。因此Ronaghi也想寻求一种更好的解决方案。
2006年Ronaghi听说了Parascale,Parascale正在开发一种可以在x86 Linux和戴尔服务器等常用系统或设备上运行的虚拟存储网络(VSN)。Ronaghi与Parascale取得了联系,因此当VSN上市的时候,Ronaghi成了Parascale的第一个用户。
Ronaghi在2007年秋季采用了VSN以来就一直对它的表现非常满意。
Ronaghi表示,VSN的安装非常简便,就像使用一般的软件一样。他说:“VSN有一个非常不错的用户图形界面,使用非常简便,所以我们可以检测出硬件设备上的工作负载情况。我们可以自己制定规则,至少保留数据三到四份备份。因此,如果我们有两个磁盘驱动器或者两台服务器发生故障的话,我们完全不必担心丢失数据。”
Ronaghi还对VSN能够在SGTC小组的戴尔x86服务器上运行感到非常满意,这意味着他们不必去购买额外的硬件设备或者应用,并且可以在必要的时候进行拓展。目前,SGTC已经可以存储容量达3TB的数据,但是他们还将在2008年上半年将系统容量拓展到可以存储10TB的数据。
除了以上提到的可以帮助SGTC将容量拓展到他们所需水平的特点之外,Parascale VSM的另一大特点就是处理速度非常快。Ronaghi表示:“这对我们来说非常特别,因为有了归档系统之后,你可能只需要拓展系统而不必同时拓展带宽。”他说,有了VSN用户读取数据时系统的速度就不会慢下来,为用户的使用提供了很大的便利。
可扩展的解决方案
Parascale VSN与其它存储厂商的解决方案的不同之处在于Parascale VSN的可拓展性、可以存储超高像素图像等容量较大的文件、以及可以使用x86服务器上的软件等特点。
Parascale首席执行官Bill Evans表示:“我们提供了业内唯一一套可以在业内标准硬件上配置文件系统的存储解决方案。其他一些方案是要求NAS设备或者SAN的,但是所有这些产品都是用户定制的硬件与软件融合的解决方案。你可以在任何一款Best Buy(美国家电连锁巨头)购买的计算机上运行我们的软件。”
Evans表示:“斯坦福基因组技术中心面临的挑战之一就是容量非常大的超高像素图像。他们不必采用一种颠覆式的升级方法(比如用存储容量50TB的NAS或者SAN设备替代原先容量10TB的设备,年年周而复始……),现在他们只要通过网络就可以大大拓展存储空间——因为我们提供的是一个网络方案而不是一个应用方案。所以,如果他们配置了我们提供的三个存储节点,他们就可以在每个存储节点上增加更多的存储空间或者增加更多的存储节点,这些多不会对目前的配置操作产生任何影响,最大的好处是不必再进行原来那种颠覆式的升级操作了。”这些都将为像SGTC这样的用户节省下大量的成本资金。
谈到那些潜在的Parascale用户,Evans表示:“一旦你需要更多的服务器来管理存储的时候,我们就是你们的最佳选择。更确切地说,我们的解决方案适用于那些数据存储容量至少3TB、使用x86服务器、接受这种存储拓展方式的企业用户。”
阅读(539) | 评论(0) | 转发(0) |