首页　| 　博文目录　| 　关于我

博客访问： 2342959
博文数量： 691
博客积分： 0
博客等级：民兵
技术积分： 2660
用户组：普通用户
注册时间： 2014-04-05 12:49

个人简介

不浮躁

文章分类

全部博文（691）

工具（1）
C++（1）

多态与虚函数（0）
Python（1）
规划（4）
OpenGL（7）

入门例子（2）
Java/Android（52）

JNI（1）

Intent/Handler（3）

Android应用（11）

Android架构（3）

数据存储（4）

布局（6）

BroadcasRec（1）

ContentProvider（1）

Activity（3）

Service（2）
数据结构和算法（5）

图（0）

树（0）

栈（0）

队列（0）

链表（0）
硬件（13）

PNP和NPN（1）

电路符号（0）

80386（1）

硬件设计详细文档（1）
云计算和大数据（19）

飞天系统（1）

hadoop（7）

云存储（4）
虚拟化FreeRdp（30）

X库（5）

Hyper-V（0）

域服务器（3）

Citrix（3）

VMWware（1）

FreeRdp（4）

Spice（5）
C（40）

glib（1）

指针（2）

数组（0）

三大结构（0）

ACM（1）

结构体（1）

关键字（2）

C语言调试信息（1）
linux基础（126）

通信（4）

线程（0）

命令（3）

mount（2）

ubuntu（2）

网络(socket)（20）

ARM交叉编译环境（7）

apt-get（1）

linux内存分析（7）

进程（13）
系统移植（118）

Makefile（0）

内存管理（1）

文件系统（12）

Linux 0.12（8）

Busybox（2）

Android移植（11）

linux内核移植（14）

uboot移植（34）
linux驱动（88）

基础总结（5）

platform（1）

总线设备驱动（2）

中断（3）

网络驱动（2）

字符驱动（22）

块驱动（4）
数据库(sqlite)（6）
编解码（14）

YUV（1）

FrameBuffer（1）
shell（39）

if（1）

grep/pgrep（1）

awk（2）

touch（1）

sed（0）

tee（0）
Qt（89）

QML（1）

Qt应用（2）

Qt调用数据库（2）

信号与槽（2）

组件设计QWidget（0）

进线程（1）

QT4.8版本移植（5）
ARM（29）

A20（5）

platform（1）

LED（2）

I2C（2）

DDR（0）

ARM处理器（1）

rk3188（2）

移植（0）

SPI（4）

Nand/eMMc（1）
未分配的博文（9）

文章存档

2019年（1）

2017年（12）

2016年（99）

2015年（207）

2014年（372）

我的朋友

Hadoop

一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throug惠普ut）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。

Hadoop最先由Google Lab开发的Map/Reduce和Google File System(GFS)的启发。2006年3月份，Map/Reduce和Nutch Distributed File System (NDFS)分别被纳入称为Hadoop的项目中。

Hadoop是最受欢迎的在Internet上对搜索关键字进行内容分类的工具，但它也可以解决许多要求极大伸缩性的问题。例如，如果您要grep一个10TB的巨型文件，会出现什么情况？在传统的系统上，这将需要很长的时间。但是Hadoop在设计时就考虑到这些问题，采用并行执行机制，因此能大大提高效率。

Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop是可靠的，因为它假设计算元素和存储会失败，因此它维护多个工作数据副本，确保能够针对失败的节点重新分布处理。Hadoop是高效的，因为它以并行的方式工作，通过并行处理加快处理速度。Hadoop还是可伸缩的，能够处理PB级数据。此外，Hadoop依赖于社区服务器，因此它的成本比较低，任何人都可以使用。

Hadoop有许多元素构成。其最底部是Hadoop Distributed File System（HDFS），它存储 Hadoop 集群中所有存储节点上的文件。HDFS（对于本文）的上一层是MapReduce引擎，该引擎由JobTrackers和TaskTrackers组成。

阅读(1631) | 评论(0) | 转发(0) |

上一篇：内核和文件系统移植

下一篇：Linux的shell中echo改变输出显示样式

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6