Chinaunix首页 | 论坛 | 博客
  • 博客访问: 49551
  • 博文数量: 14
  • 博客积分: 74
  • 博客等级: 民兵
  • 技术积分: 85
  • 用 户 组: 普通用户
  • 注册时间: 2011-11-17 22:42
文章分类
文章存档

2012年(5)

2011年(9)

我的朋友

分类:

2012-01-21 00:55:01

    hadoop这个重量级的"炸弹"近些年已引爆云存储和云计算,相信作为技术人的我们都对它略知一二吧,都说财力代表现在的努力,学习能力代表将来的成就,大数据分析已成趋势,你开始学习了吗?本文主要记录博主们关于hadoop的一些学习、使用的博文记录,也为第二期博客电子期刊做一个继续与补充。 http://focus.it168.com/topic/2012/1-19/blogep/index.html

 
入门篇
Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可 以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的
Hadoop分布式文件系统:结构与设计

MapReduce 映射与化简算法 http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409646

Google MapReduce介绍 http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409645

 
系列学习篇
 作者阅读hadoop-0.20.203.0官方手册的学习笔记。
 记录hadoop集群的配置和运行
 Hadoop的MapReduce的java编程方法
 记录HDFS的设计。
 MapReduce与HDFS的结合。不打算细致的分析代码的所有细节,目标是理解MapReduce是怎么run在HDFS上的。
布式计算开源框架Hadoop介绍── 分布式计算开源框架Hadoop入门实践(一) http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842299
Hadoop中的集群配置和使用技巧--分布式计算开源框架Hadoop入门实践(二)
分布式计算开源Hadoop基本流程与应用开发── 分布式计算开源框架Hadoop入门实践(三)http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842301
 
 
 
    链接:http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842417
数据组织  兼容HDFS的应用都是处理大数据集合的。这些应用都是写数据一次,读却是一次到多次,并且读的速度要满足流式读。HDFS支持文件的write- once-read-many语义。一个典型的block大小是64MB,因而,文件总是按照64M切分成chunk,每个chunk存储于不同的 Datanode

  链接:http://blog.chinaunix.net/space.php?uid=20761674&do=blog&id=74981

 

 

hadoop编程篇

链接:http://blog.chinaunix.net/space.php?uid=25098298&do=blog&id=95977

 http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409647

Hadoop编程入门 http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842422

欢迎在此贴下方继续分享您关于hadoop学习、使用的经验!!

·请参与继续分享的博主们在评论里贴博文链接与分类

阅读(2901) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~