Hadoop之常见错误集锦-scq2099yt-ChinaUnix博客

施昌权--淘宝卫霍shicq.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

scq2099yt

博客访问： 5852351
博文数量： 291
博客积分： 0
博客等级：民兵
技术积分： 7924
用户组：普通用户
注册时间： 2016-07-06 14:28

个人简介

阿里巴巴是个快乐的青年

文章分类

全部博文（291）

人工智能（16）

基础数学（1）

GPU优化（2）

TensorFlow（3）

机器写作（1）

深度学习（2）

机器学习（2）

机器翻译（1）

NLP算法（1）

NLP工具（1）

NLP科普（1）

AI科普（1）
IT咨询（1）

mac（1）
计算广告学（0）

计算广告学科普（0）

广告过滤（0）

反点击作弊（0）

广告推荐算法（0）

行为习惯广告（0）

广告排序算法（0）

广告匹配算法（0）

广告索引架构（0）
Web技术（10）
大数据（1）

自然语言处理（1）

深度学习（0）

机器学习（0）

社交网络（0）

数据挖掘（0）

个性化推荐（0）
团队建设（5）

产品相关（0）

运维相关（1）

测试相关（3）

敏捷开发（1）
广告技术（12）

移动广告（1）

人群定向技术（1）

广告技术科普（10）

RTB技术（0）
高性能服务器（15）

调试（2）

CPU（2）

调优（2）

监控（2）

内存（3）

并发（1）

锁（0）

IO（3）
网络通讯（4）

HTTP（1）

TCP（3）
集群（3）
移动互联网（6）

Cocos2D-HTML5（0）

Cocos2D-x（0）

Cocos2D（1）

iOS（1）

Android（4）
闲聊杂侃（11）
浏览器（3）

奇淫技巧（1）

Webkit（2）
IM即时通信（5）

OpenFire（0）

Jabber/XMPP（1）

Ejabberd（4）
云计算（0）

KVM/Xen（0）

OpenShift（0）

Cloud Found（0）

OpenStack（0）
分布式（0）

Two-Phase C（0）

MVCC（0）

Lease（0）

Quorum（0）

CAP（0）

Consistent （0）

Gossip（0）

Paxos（0）
Hadoop系列（16）

MapReduce（2）

Hive（0）

Zookeeper（0）

HDFS（3）

Hadoop（9）

HBase（2）
Amazon系列（1）

EC2（0）

AWS（0）

S3（0）

Dynamo（1）
Google系列（1）

GAE（0）

ProtoBuffer（1）

BigTable（0）

Chubby（0）

MapReduce（0）

GFS（0）
架构框架（0）

Node.js（0）

Avro（0）

Shrift（0）
算法与数据结构（27）

字符串（8）

排序（7）

其它（1）

查找（1）

链表（5）

树（5）
编程语言（77）

C++11（1）

JavaScript（1）

JSP（0）

HTML（1）

Java（9）

Shell（15）

Python（11）

Golang（7）

Erlang（6）

PHP（0）

Lua（7）

C++（17）

C（2）
搜索引擎（7）

seo（1）

Nutch（0）

垂直搜索引擎（1）

解密搜索引擎技术（5）

Solr（0）

Sphinx（0）

Lucene（0）
我的开源项目（0）
开源代码解析（69）

Log4cpp（0）

Tomcat（3）

Storm（1）

LevelDB（0）

Apache（1）

fastDFS（0）

HyperTable（0）

Keepalived（1）

LVS（1）

Linux（18）

Varnish（0）

Squid（0）

Heartbeat（0）

Libevent（1）

Nginx（17）

Haproxy（2）

HandleSocket（0）

neo4j（0）

MongoDB（2）

Memcached（3）

Redis（6）

MySQL（4）

RabbitMQ（9）

ZeroMQ（0）
未分配的博文（1）

文章存档

2018年（21）

2017年（4）

2016年（5）

2015年（17）

2014年（68）

2013年（174）

2012年（2）

我的朋友

相关博文

Hadoop之常见错误集锦

分类： HADOOP

2014-01-31 00:17:03

下文中没有特殊说明，环境都是CentOS下Hadoop 2.2.0。
1、伪分布模式下执行start-dfs.sh脚本启动HDFS时出现如下错误：

      vi打开libexec/hadoop-config.sh中，查找JAVA_HOME is not set and could not be found，找到后在这一行if [[ -z $JAVA_HOME ]]; then的前面添加如下语句即可：
        export JAVA_HOME=/usr/java/jdk1.7.0_45
      保存后，重新执行start-dfs.sh脚本，然后执行jps就能看到NameNode、DataNode等你想看到的东西了：

2、执行start-dfs.sh脚本启动Hadoop 0.20.2 HDFS时出现如下错误：
        localhost: Error: JAVA_HOME is not set.
        localhost: Error: JAVA_HOME is not set.
      vi打开conf/hadoop-env.sh，添加如下语句即可：
        export JAVA_HOME=/usr/java/jdk1.7.0_45

3、上传本地文件到HDFS上时出现如下错误：
        WARN hdfs.DFSClient: DataStreamer Exception: org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /user/root/input01/file01 could only be replicated to 0 nodes, instead of 1
      这是由于没有添加节点的原因，即需要先启动namenode，再启动datanode，然后自动jobtracker和tasktracker，如下即可：
      （1）重启namenode：
      #hadoop-daemon.sh start namenode
      （2）重启datanode
      #hadoop-daemon.sh start datanode

------------------------------------------------以下是Windows下Eclipse连接Linux下Hadoop编译运行程序出现的问题------------------------------------------------
4、Run on Hadoop编译程序时，出现如下错误：
        Exception in thread "main" java.io.IOException: Cannot run program "chmod": CreateProcess error=2, ?????????
        原因是执行不了Linux命令，解决方法是安装Cygwin并把C:\cygwin64\bin路径添加到path环境变量中去。
      需要注意的是，安装过程中至少需要选择devel和shell这两个包。

5、Run on Hadoop编译程序时，出现如下错误：
        WARN mapred.JobClient: No job jar file set. User classes may not be found. See JobConf(Class) or JobConf#setJar(String)
      原因是因为job.setJarByClass使用了xxx.class的类加载器来寻找包含该类的Jar包，然后设置该Jar包为作业所用的Jar包。但是我们的作业Jar包是在程序运行时才打包的，而xxx.class的类加载器是AppClassLoader，运行后我们无法改变它的搜索路径，所以使用setJarByClass是无法设置作业Jar包的。
      将本工程导出的jar包放到工程根目录下面，并在提交程序前添加下面的设置：
        conf.set("mapred.jar", "xxx.jar"); //其中，xxx.jar是你导出的jar文件名，注意第一个参数不要拼写错了。

6、Run on Hadoop编译程序时，出现如下错误：
        org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security .AccessControlException: Permission denied: user=xxx, access=WRITE, inode="hadoop": hadoop:supergroup:rwxr-xr-x
        因为Eclipse使用Hadoop插件提交作业时，会默认以xxx身份去将作业写入hdfs文件系统中，对应的也就是HDFS上的/user/xxx，我的为/user/root，由于xxx用户对hadoop目录并没有写入权限，所以导致异常的发生。解决方法为：放开 hadoop目录的权限，方法有二：
      （1）执行如下命令
        $ hadoop fs -chmod 777 /user/root
      （2）修改Hadoop配置
      修改hadoop的配置文件：conf/hdfs-core.xml，找到dfs.permissions的配置项，将value值改为false，具体如下：

            dfs.permissions
            false

                If "true", enable permission checking in HDFS.
                If "false", permission checking is turned off, but all other behavior is unchanged.
                Switching from one parameter value to the other does not change the mode, owner or group of files or directories.


        修改完后重启下hadoop的进程使之生效即可。
------------------------------------------------end------------------------------------------------

7、MapReduce操作HBase出现如下错误：
        Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration
        Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/zookeeper/KeeperException
      这是因为Hadoop在调用HBase包时找不到相应jar包，解决办法是将HBase目录下的hbase-0.90.4.jar和lib目录下的zookeeper-3.3.2.jar包拷贝到hadoop/lib下即可，其它这类问题类似。

8、MapReduce操作HBase出现如下错误：
        org.apache.hadoop.hbase.TableNotFoundException: Cannot find row in .META. for table
      这是因为HBase中不存在要插入数据的表，在hbase shell中手工创建表格create 'xxx', 'xxx'即可。

9、MapReduce跑job时如果出现如下错误：
        java.lang.RuntimeException: java.lang.ClassNotFoundException:
      这是因为Hadoop在找class时没有从jar包中找而出错，解决办法是删除除开jar和.java文件外的所有目录和文件即可。

阅读(16182) | 评论(1) | 转发(0) |

上一篇：Nginx深入详解之变量

下一篇：HDFS初探之Java接口

给主人留下些什么吧！~~

scq2099yt2014-01-31 00:17:31

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6