Hadoop信赖大家有所理解了,那里向大家引见一下nutch+hadoop设置使用成绩,主要包罗nutch+hadoop设置以及设置过程汇总碰到的成绩,信赖经过本文的引见大家对nutch+hadoop设置有必然的熟悉。
AD:
本节向大家引见nutch+hadoop设置方面的内容,主要有nutch+hadoop设置的法式和设置时出现的成绩及解决步履方法,迎接大家一路往教习,信赖经过本节的引见您会越到很多有关Hadoop的常识。
nutch+hadoop设置使用
设置nutch+hadoop
1,下载nutch。若是不需求特天开辟hadoop,则不需求下载hadoop。因为nutch里面带了hadoopcore包以及相干设置
2,竖立目次(根据本人康乐爱好)
/nutch
/search(nutchinstallationgoeshere)nutch安拆到那里,也即是解压到那里
/filesystemhadoop的文件体系存放面
/local/crawl后放置索援引往search用的
/home(nutchuser"shomedirectory)若是您用体系用户,那个基本出用
/tomcat启动nutch.war用往search索引的app
3,conf/hadoop-env.sh必然要设置JAVA_HOME,否则体系起不往
4,设置master和slave的ssh,否则每次皆要输入passwd
ssh-keygen-trsa
然后回车便可
cpid_rsa.pubauthorized_keys
(copy到别的的slave上)scp/nutch/home/.ssh/authorized_keysnutch@devcluster02:/nutch/home/.ssh/authorized_keys
5,将bin和conf下统统的.sh、nuch、hadoop文件dos2unix
dos2unix/nutch/search/bin/*.sh/nutch/search/bin/hadoop
设置hadoop-size.xml
6,记着要把master文件从nutch/hadoopcopy到那个nutch中,理当是bug。也即是讲启动需求那个文件,文件内容为默许的localhost便可(若是是分布式,可以或许需求设置)
7,nutch+hadoop设置过程傍边需求格局化namenode
bin/hadoopnamenode-format
1 2 下一页
内容导航
基于Eclipse的开源框架手艺与真战
当前,开源框架层见叠出,它为用户提供了通用的解决方案,同时也删加了用户的教习难度。开源是一把“双刃剑”,一方面它共享了资
阅读(1053) | 评论(0) | 转发(0) |