Honeycomb释疑：海量智能数据存储-ccjh5753-ChinaUnix博客

存储交换

首页　| 　博文目录　| 　关于我

ccjh5753

博客访问： 202442
博文数量： 179
博客积分： 5010
博客等级：大校
技术积分： 2040
用户组：普通用户
注册时间： 2008-07-25 10:25

文章分类

全部博文（179）

未分配的博文（179）

文章存档

2011年（1）

2008年（178）

我的朋友

相关博文

Honeycomb释疑：海量智能数据存储

分类：服务器与存储

2008-07-26 12:51:17

　　Honeycomb 项目是一个创新的存储系统，它向这个领域引入全新水平的智能性和可编程性。我们与存储集团 Honeycomb 高级产品经理 Mike Davis 进行了谈话。

　　问:为什么对 Honeycomb 寄予如此高的期望?

　　MIKE: 这是一种与众不同的创新方法，已经过好几年的研究。Honeycomb 是第一个具有应用可扩展性框架的存储系统，它使开发人员可以将低级功能从应用服务器卸载到存储系统，这些功能包括元数据管理、查询以及其他相应的数据服务。

　　从应用服务器卸载某些功能，并使它们更加接近存储系统中的数据，将会提高应用的整体性价比，并能增强可靠性和可扩展性。

　　问:Honeycomb 被称为可编程的存储。这是为什么呢?

　　MIKE: 从此项目开始实施时起，我们的目标就是要为存储系统提供一个可编程性要素，并增添真正意义上的智能性。Honeycomb 以应用认知的可编程存储为特征，而可编程存储是一种可扩展的元数据系统，它使得管理和处理大型数字资产储存库更加容易。该系统既提供了离散数据库的灵活性，又增强了可扩展性和可靠性。元数据框架不受文件类型约束，并作为系统结构的嵌入式自有部分运行。

　　第二级可编程性是最令我激动的地方:实现一个智能存储系统。Honeycomb 可在数据进出系统时迅速处理数据，这正是它对许多客户和应用合作伙伴来说真正具有战略意义之处。

　　过去，在应用服务器上执行的任务和在存储系统中执行的任务，或者在其层面之上和在层面之下所执行的任务之间，常常有著非常清晰的区别。Honeycomb 的优势是使这种区别变的模糊起来。

　　问:Honeycomb 如何运作?

　　MIKE: Honeycomb 有两个要素:一个以群集体系架构为基础的、高度可靠的串行ATA(SATA)型存储系统，以及一个用于数据访问和管理的高度可扩展的框架。群集中嵌入了全分布式高性能数据库技术，此技术与存储系统非常协调一致。

　　Honeycomb　的体系架构设计宗旨是:减少或消除原有体系架构中存在的瓶颈和单点故障。内置的并行性提升了性能，并为查询及数据 I/O 提供出众的性能。

　　“我们知道，尽管数据在以指数级增长，但 IT　预算往往变化不大，而且我们的目标是使单个系统管理员能够管理百万兆字节的存储。”

　　问:Honeycomb 为客户解决哪些难题?

　　MIKE: 开发 Honeycomb　的目的是解决大型储存库管理中不断出现的问题，并且我认为，随著时间的推移，需要收集的非结构化数据的数量还会继续增加。此设计的重点集中在降低管理和服务成本上。我们知道，尽管数据在以指数级增长，但 IT 预算往往变化不大，而且我们的目标是使单个系统管理员能够管理百万兆字节的存储。

　　要找到便宜的存储硬件并不难，关键的策略在于如何减少对配置、维修、供应、服务、数据迁移以及直接产生系统实际成本的其他任务的需要。

　　大型储存库需要具备故障弹性，即有能力承受多种类型的故障，同时不会遭受丢失数据的风险。通过并行性，Honeycomb 提供无与伦比的可靠性，而且已经证明优于客户可在任何 SAN　环境中获得的可靠性水平。

　　对于这些客户来说，最后一个未解决的难题在于对元数据和用于描述数据的大量属性的管理，并能够即时重新调用。

　　问:Honeycomb 如何管理元数据?

　　MIKE: 一个可扩展的元数据框架实际上只是实现可编程性和应用认知能力的第一步。这是我们能从应用服务器快速卸载以便让应用服务器管理更高级应用任务的最明显的东西。

　　与这些储存库应用关联的元数据与数据具有同等的重要性。元数据包含像患者姓名或住院日期这样的属性。它只占数据本身大小的很小一部分，但是如果没有元数据，就无法浏览数据。

　　必须具备极高的可靠性才能对元数据进行管理，并且元数据还必须能够随著数据的增加而逐步扩展，因为数据增加方式与元数据增加方式相关。在 Honeycomb 中，与其他存储解决方案相比，可以更加可靠、更加可扩展且更加经济而有效地存储元数据，这是因为没有为元数据专设单独的数据库，包括元数据在内的所有数据都存储在同一个系统中。

　　问:整个创新有助于降低拥有成本吗?

　　MIKE: 毫无疑问。在这样的系统中有三种方法可以降低总体拥有成本 (TCO)，我们对它们都进行了积极的探索。第一种方法是使用低成本组件，我们已经通过采用低成本服务器、以太网和 SATA 硬盘实现了。另一种方法是降低管理和控制方面的复杂性。Honeycomb 不存在卷管理，没有主机总线适配器(HBA)，没有 RAID，也不需要管理挂载点。

　　第三种方法是减少或消除与服务相关的费用。Honeycomb 自己进行故障检测，并透明地自我修复，因而消除了请求紧急服务的必要。每四至六个月要通过延期服务模式对所有不能工作的部件进行更换，这样大家就都可以扔掉其寻呼机了。

　　问:Honeycomb 的理想客户是谁?

　　MIKE: 短期来说，理想客户应是媒体、娱乐、生命科学或政府机构领域的服务提供商或公司。需要通过内部应用程序管理大量非结构化数据收集工作的机构几乎都会从 Honeycomb 中受益。

　　“该团队正在寻找新的方法来组织数量巨大的不同信息，而且他们认为必须找到一种方法，用一种更具协作性的方式将服务器与存储器结合起来。”

　　问:Honeycomb 已在 Sun 公司实验室成功开发出来。该项目是如何启动的?

　　MIKE: Honeycomb 项目是于 2003 年春天在 Sun 公司实验室启动的，参加者还包括现代搜索技术领域的一些专家。他们确信，现有的存储方法仍然无法解决大规模数据管理的问题，于是他们组织了一个由杰出人才组成的团队，共同规划一种新的存储系统。该团队的成员包括 Bill Joy 和 Greg Papadopoulos、存储专家、关注低成本硬件设计的工程师以及来自并行存储领域的新型人才。

　　该项目是按照几个主题组织的。该团队正在寻找新的方法来组织数量巨大的不同信息，而且他们认为必须找到一种方法，用一种更具协作性的方式将服务器与存储器结合起来。他们认为将这两层合并在一起将会提供一个整体上更加高效的解决方案，他们的思路是正确的。

　　问:您认为 Sun 公司在开发此类技术方面具有优势吗?

　　MIKE: 毫无疑问。由于我们是一家系统供应商，所以应用部署的全过程中都能看到 Sun 公司的存在。我们可以放眼从人类客户端到磁盘存档的整个环节，并能发现什么地方存在瓶颈和低效率。我们已经具备构建这种系统所需的大部分专门技术和知识产权。 Honeycomb 利用了 Solaris 10、Java、内部数据库技术、群集、智能网络、自我修复和负载平衡技术。

　　任何其他公司都不具备相似水平的综合能力，我们也没有发现传统的存储供应商有能力快速开发出相同水平的存储系统。

　　问:您能例举一项典型 Honeycomb 事务来说明其功能吗?

　　MIKE: 一位医师启动一个与 Honeycomb 存储系统的典型交互，这位医师在其本地图像存储与通信系统 (PACS) 上研究医学图像。我们假设他想查看来自一次放射医学研究中的 20 个缩略图。首先，该软件向 Honeycomb 发出一条查询，请求在数据库搜索某个医师医治的以及一定日期范围的、具有特定患者 ID 的所有图像。

　　Honeycomb 会查找到这些图像，它不是在局域网之间发送数千兆字节数据，以便在工作站分解成各个缩略图，而是迅速更改数据并在局域网之间发送已经是缩略图形式的 100 KB 信息。应用服务器无需进行额外处理或传送同样数量巨大的数据，因为 Honeycomb 已经自行搜索并处理了这些数据。

　　为了使 PACS 软件供应商能够调用此类丰富的数据服务，开发人员就必须具备一个应用程序接口 (API)。API 使开发人员可以存储元数据属性、查找项目、发出检索命令并处理数据。

　　问:产品会在什么时候发布?

　　MIKE: 在开展全球发布活动前，我们正积极努力地致力于支持生态环境的发展。目前，我们正在关注某些 OEM 和 ISV 团体。我们还在与几家拥有自己的内部应用和开发人员的客户进行直接合作。

阅读(594) | 评论(0) | 转发(0) |

上一篇：自动数据迁移：为ILM选择适合的技术

下一篇：实战：构建高效IP存储网络的五大要点

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6