Hadoop 是一个能够对大量数据进行分布式处理的框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。IT168文库图书试读第二期为大家推荐5本关于Hadoop方面的图书。
详情请点击以下链接:
阅读(1082) | 评论(0) | 转发(0) |