MapReduce初探之使用Hadoop分析数据

尘世中一个迷途小书童riverhwp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Larpenteur

博客访问： 6453399
博文数量： 2759
博客积分： 1021
博客等级：中士
技术积分： 4091
用户组：普通用户
注册时间： 2012-03-11 14:14

文章分类

全部博文（2759）

Todo（1）
Advice（151）
Linux-未分类（223）
Ubuntu（47）
Database（145）
算法&DS（77）
Android（47）
Web（214）
Geek（237）
CPPC（296）
Java（113）
Python（99）
Matlab（19）
Git（19）
SVN（11）
Gnuplot（5）
面试（0）
机器-挖掘-AI（6）
开源项目（1）
Happy Drawe（9）
Programming（144）

Tools（23）

Shell（66）

Makefile（11）

GDB（26）

vim（18）
System（628）

Author（110）

Common（4）

Memory（66）

File system（82）

Driver（19）

IO（66）

Storage（45）

General（38）

Architecture（19）

Command（64）

Kernel（115）
Virtualization（39）
Cloud（33）
Hadoop（71）
Big Data（24）
未分配的博文（100）

文章存档

2019年（1）

2017年（84）

2016年（196）

2015年（204）

2014年（636）

2013年（1176）

2012年（463）

我的朋友

最近访客

推荐博文

MapReduce初探之使用Hadoop分析数据

发布时间：2014-02-09 10:32:35

MapReduce是一种可用于数据处理的编程模型，Hadoop可以运行由各种语言编写的MapReduce程序。MapReduce程序本质上是并行运行的，因此，可以将大规模的数据分析任务交给任何一个拥有足够多机器的运营商。MapReduce的优势在于处理大规模数据集，这里以一个气象数据集分析为例说明之，查.........【阅读全文】

阅读(1228) | 评论(0) | 转发(0)

HDFS初探之数据流

发布时间：2014-02-09 10:30:55

一、文件读取剖析为了了解客户端及与之交互的HDFS、namenode和datanode之间的数据流是什么样的，可以参考下图，该图显示了在读取文件时一些时间的主要顺序：图1 客户端读取HDFS中的数据客户端通过调用FileSyste对象的open()方法来打开.........【阅读全文】

阅读(911) | 评论(0) | 转发(0)

HDFS初探之Java接口

发布时间：2014-02-09 10:30:28

Hadoop有一个抽象的文件系统概念，HDFS只是其中一个实现。Java抽象类org.apache.hadoop.fs.FileSystem定义了Hadoop中的一个文件系统接口，并且该抽象类有几个具体的实现。Hadoop对文件系统提供了很多接口，它一般使用URI方案来选取合适的文件系统实例进行交互，比如：要想列出本地文.........【阅读全文】

阅读(1083) | 评论(0) | 转发(0)

时间戳不一致导致的HRegionServer启动问题解决！

发布时间：2013-12-19 12:15:11

腾出手来对部署好的hadoop/hbase云计算平台进行取证分析测试，但是运行过程中经常会不时地node2无法正常启动HRegionserver，从而导致整个平台的计算受到影响。之前自己围绕HMaster自动关闭的问题，删除了各个节点的HDFS目录，重新格式化后问题得到了解决，但是这次问题却依旧，于是自己只好去日志中一.........【阅读全文】

阅读(1839) | 评论(0) | 转发(0)

Hadoop初探之HDFS系统架构

发布时间：2013-11-18 11:40:49

一、适应场景 HDFS是Hadoop的分布式文件系统，即Hadoop Distributed Filesystem。 HDFS以流式数据访问模式来存储超大文件，运行于商用硬件集群上。这句话信息量太大，分解开来就是HDFS适合如下场景： .........【阅读全文】

阅读(872) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6