阿里巴巴是个快乐的青年
全部博文(291)
发布时间:2014-02-10 21:29:28
为了实现横向扩展(scaling out),需要把数据存储在分布式文件系统中,一般为HDFS,由此允许Hadoop将MapReduce计算移到存储有部分数据的各台机器上。一、数据流 MapReduce作业(job)是客户端需要执行的一个工作单元,.........【阅读全文】
发布时间:2014-02-04 22:28:09
MapReduce是一种可用于数据处理的编程模型,Hadoop可以运行由各种语言编写的MapReduce程序。MapReduce程序本质上是并行运行的,因此,可以将大规模的数据分析任务交给任何一个拥有足够多机器的运营商。MapReduce的优势在于处理大规模数据集,这里以一个气象数据集分析为例说明之,查.........【阅读全文】