mapreduce理解--（转载自heipark的日志）-dsy851009-ChinaUnix博客

个人简介

效字当先，以质为本。测试开发入行十余年，辉煌过，迷茫过，持续探寻人生的激情和前进的步伐！好好生活，认真工作！

文章分类

文章存档

2015年（14）

2014年（33）

2013年（31）

我的朋友

相关博文

分类： HADOOP

2013-09-02 13:59:23

linux平台下有个ls指令，大家都很熟悉：

① ls | grep 2008 查询文件名包含2008的文件（这其实就是一个map，找到需要的数据）

② ls | grep 2008 | wc -l 计算上述指令查询文件个数（这其实就是一个reduce，对找到数据进行汇总聚合）

再来一个例子，关于SQL：select * from device

① select * from device t where t.name like 'CNC-Bj%' （这其实就是一个map，找到需要的数据）

② select count(*) from device t where t.name like 'CNC-Bj%' （这其实就是一个reduce，对找到数据进行汇总聚合）

第二个SQL的例子在hive中就是通过mapreduce实现的，①为一个map任务 ②为一个reduce任务

阅读(2226) | 评论(0) | 转发(1) |

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们