Hadoop为什么没有采用RAID？_ying091104-ChinaUnix博客

holly的ChinaUnix博客

首页　| 　博文目录　| 　关于我

ying091104

博客访问： 18031
博文数量： 5
博客积分： 0
博客等级：民兵
技术积分： 40
用户组：普通用户
注册时间： 2013-08-22 18:06

文章分类

全部博文（5）

未分配的博文（5）

文章存档

2013年（5）

2013年09月（1）
2013年08月（4）

我的朋友

最近访客

推荐博文

Hadoop为什么没有采用RAID？

发布时间：2013-08-30 10:47:45

HDFS集群没有采用RAID(冗余磁盘阵列)作为datanodes的存储设备(尽管namenode使用RAID来保护元数据不会丢失)。由于HDFS是采用在节点之间块复制的方法，所以RAID提供的冗余机制对HDFS来说是多余的。此外，RAID条带(RAID 0)常用于增加性能，但却比HDFS中用到的JBOD(Just a Bunch Of Disks)要慢，而且JBOD在所有的磁盘之间.........【阅读全文】

阅读(1470) | 评论(0) | 转发(0)

配置VNC服务步骤

发布时间：2013-08-30 10:07:34

如果使用VNC远程登录LINUX系统，配置VNC服务步骤如下：1.查看是否安装vnc服务[root@localhost ~]# rpm -q vnc-servervnc-server-4.1.2-14.el5_3.12.分配vnc端口[root@localhost ~]# vncserver :13.设置密码启动vncserver，会提示让你输入密码，在第一次登录时会让你输入两次密码.........【阅读全文】

阅读(622) | 评论(0) | 转发(0)

Hadoop中map数的计算

发布时间：2013-08-23 17:33:02

Hadoop中在计算一个JOB需要的map数之前首先要计算分片的大小。计算分片大小的公式是：goalSize = totalSize / mapred.map.tasksminSize = max {mapred.min.split.size, minSplitSize}splitSize = max (minSize, min(goalSize, dfs.block.size))totalSize是一个JOB的所有map总的输入大小，即Map input byt.........【阅读全文】

阅读(628) | 评论(0) | 转发(0)

HDFS-HA：Hadoop-Cloudera-cdh4版本的HDFS自动Failover(zk-based-failover)分析

发布时间：2013-08-23 11:07:05

本文基于cloudera-Hadoop-cdh-4.01版本进行分析在这个特定版本支持HA的Hadoop内，FailoverController主要是通过一个独立于NN的进程来完成的，在这个版本内是通过zookeeper的功能来完成的，所以这个版本内的FailoverController也称为ZKFC。这部分代码主要存在于org.apache.hadoop.ha以及org.apache.hadoop.ha.protocol.........【阅读全文】

阅读(1003) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6