通过管道向 hadoop put 文件（转）-liukaiyi-ChinaUnix博客

liukaiyiskynet.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

liukaiyi

博客访问： 668031
博文数量： 149
博客积分： 3901
博客等级：中校
技术积分： 1558
用户组：普通用户
注册时间： 2009-02-16 14:33

文章分类

全部博文（149）

数据挖掘组（5）
linux（2）
基础知识（2）
读书（8）

mbalib:营销分析（1）

《引爆流行》（1）

《长尾理论》（1）

《云计算》（4）
工具服务器（15）

wiki - trac（1）

版本控制器（5）

消息队列（0）

gearman（3）

同步/备份（2）

调度系统（2）

nginx（1）
编辑器（9）

vim（9）
产品的智慧（9）

提纲（0）
数据分析（11）

load（0）

cleansing（2）

transform（0）

extract（0）

算法（1）

数据结构（0）
语言（28）

shell（1）

R（5）

english（0）

c（0）

javascript（0）

perl（7）

python（9）
数据存储（57）

postgres（7）

hadoop（29）

voldemort（2）

cassandra（1）

infobright（2）

mysql（9）

mongodb（3）
未分配的博文（3）

文章存档

2014年（2）

2013年（10）

2012年（32）

2011年（21）

2010年（84）

我的朋友

相关博文

通过管道向 hadoop put 文件（转）

分类：数据库开发技术

2010-07-24 11:43:37

转自：

使用 hadoop file shell 可以方便地向 hdfs put 文件，但是，该 shell 不支持从管道读取数据并放到 hdfs 文件中。它仅支持这样的 put 命令：

cd $HADOOP_HOME  
bin/hadoop fs -put localfile $hdfsFile  
bin/hadoop fs -put localfiles $hdfsDir  

幸好，主流的 unix （linux,bsd等）都有一个 /dev/fd/ 目录，可以用它实现从管道 put 文件

Shell代码 
cd $HADOOP_HOME  
if bin/hadoop fs -test -d $hdfsFile  
then  
    echo "$hdfsFile is a directory" >&2  
    exit 1  
fi  
cat localfileS | bin/hadoop fs -put /dev/fd/0  $hdfsFile  
if [[ "0 0" == ${PIPESTATUS[*]} ]]  
then  
    echo success  
else  
    bin/hadoop fs -rm $hdfsFile  
    echo failed >&2  
fi   

其中，使用 PIPESTATUS 检查错误。

需要注意，使用 /dev/fd/0 put 文件时，hdfsFile 必须事先不存在，并且不能是一个目录，如果hdfsFile实际上是一个目录，那么，put 仍然正确执行，但是，hdfs 中的文件名将是 hdfsFile/0

/dev/fd/ 中是进程所有已打开的文件描述符列表，例如 /dev/fd/0 代表标准输入，/dev/fd/1 代表标准输出，/dev/fd/2 代表标准错误输出，等等，打开 /dev/fd/n 相当于调用 dup(n) 。

阅读(1233) | 评论(0) | 转发(0) |

上一篇：mysql duplicate key

下一篇：在python、perl、php中使用Berkeley DB (转)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6