MapReduce中的一些自定义-niao5929-ChinaUnix博客

birdofpreybirdofprey.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

niao5929

博客访问： 7334762
博文数量： 3857
博客积分： 6409
博客等级：准将
技术积分： 15948
用户组：普通用户
注册时间： 2008-09-02 16:48

个人简介

迷彩潜伏隐蔽伪装

文章分类

全部博文（3857）

大数据计算（149）
随想（82）
编程语言（372）

python（3）

lisp（0）

JAVA C++（2）

GOLANG（0）
数据库（115）
高可用集群（412）

分布式系统（26）

SDN（0）

细胞节点（78）

分布式网络（5）
Linux（1172）

SHELL（10）

网络（209）
未分配的博文（1555）

文章存档

2017年（5）

2016年（63）

2015年（927）

2014年（677）

2013年（807）

2012年（1241）

2011年（67）

2010年（7）

2009年（36）

2008年（28）

我的朋友

相关博文

MapReduce中的一些自定义

分类：网络与安全

2014-03-14 11:04:05

原文地址：MapReduce中的一些自定义作者：xu954217943

1.计数器：可以让开发人员以全局的视角来审查程序运行状况和各个指标。

   获得计数器：Conter myConter = config.getConter("组的名字"，"计数器名");

   为计数器设置初值：myConter.setValue(初始值);

   增加：myConter.increment();

2.Combiners（规约）

   每一个map会产生大量的输出，combiner的作用就是在map端对输出做一次合并，以减少到reduce的数据量，网络传输少。

   只能在本地map中进行合并，并不能跨map执行，所以还需要reduce

   combiner是选配的，因为对于某些逻辑，使用前与使用后的计算结果不一致。

   job.setCombinerClass(MyReduce.class);

3.Partitioner（分组）

       1.mapreduce的默认partitioner是HashPartitioner

       2.自定义

   class KpiPartitioner extends Partitioner{

       @Override

       public int getPartition(Text key, LongWritable value, int numPartitions) {

          return (key.toString().length()==11)?0:1;

       }

}

然后在main方法中加入

   job.setPartitionerClass(KpiPartitioner.class);

   job.setNumberReduceTasks(2);

4.排序和分组

   1.在map和reduce阶段进行排序时，比较的是k2,v2是不参与排序比较的，如果想让v2参与排序，需要把k2和v2组装成新的类，作为k2，才能比较。

   2.分组也是按照k2进行的。

class NewGroup implements RawComparator{

   /**

    * 比较字节数组中指定的字节序列的大小

    * b1：第一个参与比较的数组

    * b2：第二个参与比较的数组

    *

    * s1：第一个参与比较的字节数组的开始位置

    * s2：第二个

    *

    * l1：比较长度

    */

   @Override

   public int compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) {

       return WritableComparator.compareBytes(b1, s1, 8, b2, s2, 8);

   }

       @Override

       public int compare(NewKey o1, NewKey o2) {

       // TODO Auto-generated method stub

       return 0;

   }

}

然后在main中

job.setGroupingComparatorClass(NewGroup.class).

阅读(459) | 评论(0) | 转发(0) |

上一篇：Go语言连接sql server

下一篇：LVS、Nginx和HAProxy负载均衡器对比总结

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6