hadoop使用笔记-jiangwen127-ChinaUnix博客

EricLiseo2register.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

jiangwen127

博客访问： 2484614
博文数量： 392
博客积分： 7040
博客等级：少将
技术积分： 4138
用户组：普通用户
注册时间： 2009-06-17 13:03

个人简介

范德萨发而为

文章分类

全部博文（392）

nosql（1）
c/c++（7）
machine lea（67）
设计模式（1）
web架构（35）
关系型database（23）
distributed（11）
fuckingwindows（1）
SE（24）
life（9）
berkeleyDB（4）
beauty of math（3）
Java_study（11）
algorithm（77）
kernel（16）
hadoop（13）
programming（8）
network（9）
linux operation（14）
bash（12）
reading（5）
STL using（8）
intern（0）
job_hunter（29）
未分配的博文（4）

文章存档

2017年（5）

2016年（19）

2015年（34）

2014年（14）

2013年（47）

2012年（40）

2011年（51）

2010年（137）

2009年（45）

我的朋友

相关博文

hadoop使用笔记

分类：服务器与存储

2010-01-21 23:17:21

下面提到的操作都是基于我的这个hadoop安装方法的：
http://blog.chinaunix.net/u3/99156/showart.php?id=2156593

按照Hadoop官网中的Quick start操作(这里http://hadoop.apache.org/common/docs/current/quickstart.html)启动hadoop。

1.Hadoop默认创建的dfs文件系统在哪里？
/tmp/hadoop-xxxxx/,每次重启系统之后，这个文件系统就不存在了，正在研究如何指定dfs的目录。

2.Hadoop dfs文件操作。
具体参数请看bin/hadoop dfs中的说明，这里只作简单的介绍:

-put localfile dst

上传，上传之后文件名不在是本地的文件名，但是内容是没有变的，也就是内容没有经过压缩(我测试上传的文件很小，不排出在大文件的情况下会出现压缩或文件分片的情况)。
有人回答：当从本地向hdfs复制文件时，且本地文件非常大，hdfs是如何存储它的。从文件头开始均匀按块划分，各块均衡地分布存储到集群的各节点上，默认每块大小为64M，而且是完全地存储在DataNode节点上，以文件的形式存在.
我测试的文件存储在/tmp/hadoop-xxxx/dfs/data/current/blk_xxxxxxxxxx

-get dfssrc localdst

下载

-ls

跟bash一样，这时列出的名字即是上传之前的localfile的名字，说明很可能在dfs存储中保存了一个本地文件名字到dfs文件名字的映射。

阅读(1210) | 评论(0) | 转发(0) |

上一篇：ubuntu9.10上安装hadoop

下一篇：ubuntu上运行mapreduce的word count

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6