MapReduce设计模式--分区_zpf1218-ChinaUnix博客

月月鸟飞

首页　| 　博文目录　| 　关于我

zpf1218

博客访问： 1125398
博文数量： 143
博客积分： 969
博客等级：准尉
技术积分： 1765
用户组：普通用户
注册时间： 2011-07-30 12:09

文章分类

全部博文（143）

krenel（4）
大数据（2）
spark（8）
java（2）
FastDFS（6）
mysql（5）
系统性能（7）
mongodb（0）
算法数据结构（1）
Redis（2）
分布式云计算（46）

storm（3）

MapReducer（18）

hadoop（1）
Linux（25）
chrome（2）
网络（7）
C++（10）
web（2）
软件设计（6）
程序设计（0）
操作系统（2）
数据库（2）
未分配的博文（4）

文章存档

2023年（4）

2021年（2）

2020年（4）

2019年（4）

2018年（33）

2017年（6）

2016年（13）

2014年（7）

2013年（23）

2012年（33）

2011年（14）

我的朋友

最近访客

推荐博文

MapReduce设计模式--分区

发布时间：2018-06-30 20:32:00

分区模式将记录进行分类，但它并不关心记录的顺序。其主要目的是将数据集中相似的记录分成不同的、更小的数据集分区主要原理是，自定义分区类继承Partitioner，根据业务需求实现分区函数 public int getPartition(Text key, Text value, int numPartitions)，将Key相同的记.........【阅读全文】

阅读(3131) | 评论(0) | 转发(0)

MapReducer--从Hbase读取数据

发布时间：2018-07-19 10:40:41

MapReduce输入数据源不仅可以是文件还可以是Hbase，从Hbase读取数据需要注意以下细节1、Mapper类需要从TableMapper继承，并且实现函数 void map(ImmutableBytesWritable key, Result columns, Context context)ImmutableBytesWritable key 实际上是Hbase表记录的rowkeyResult columns 是hbase.........【阅读全文】

阅读(1796) | 评论(0) | 转发(0)

MapReducer设计模式--共同好友

发布时间：2018-07-07 15:48:07

假设有如下数据：100,200,300,400,500,600200,100,300,400300,100,200,400,500400,100,200,300500,100,300600,100其中第一列表示用户ID，其余列表示用户的好友ID，我们需要统计出这些用户的共同好友其结果如下：[100,200] [300, 400] //表示用户100和200的共同好友是 300，400[100,300] [200, 400, 500].........【阅读全文】

阅读(1298) | 评论(0) | 转发(0)

MapReduce设计模式--相关性Pairs模式实现

发布时间：2018-07-06 17:17:27

点击(此处)折叠或打开import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;i.........【阅读全文】

阅读(1270) | 评论(0) | 转发(0)

MapReducer设计模式-相关性统计Stripes模式实现

发布时间：2018-07-06 17:10:50

点击(此处)折叠或打开import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.MapWritable;import org.apache.hadoop.io.Text;.........【阅读全文】

阅读(1343) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6