Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1111944
  • 博文数量: 143
  • 博客积分: 969
  • 博客等级: 准尉
  • 技术积分: 1765
  • 用 户 组: 普通用户
  • 注册时间: 2011-07-30 12:09
文章分类

全部博文(143)

文章存档

2023年(4)

2021年(2)

2020年(4)

2019年(4)

2018年(33)

2017年(6)

2016年(13)

2014年(7)

2013年(23)

2012年(33)

2011年(14)

我的朋友

发布时间:2018-07-07 16:59:10

Strom是什么      Storm是由专业数据分析公司BackType开发的一个分布式计算框架,可以简单、高效、可靠地处理大量的数据流。Twitter在2011年7月收购该公司,并于2011年9月底正式将Storm项目开源。软件核心部分使用Clojure开发,外围部分使用Java开发。      Storm可以方便.........【阅读全文】

阅读(8123) | 评论(0) | 转发(0)

发布时间:2018-07-07 15:48:07

假设有如下数据:100,200,300,400,500,600200,100,300,400300,100,200,400,500400,100,200,300500,100,300600,100其中第一列表示用户ID,其余列表示用户的好友ID,我们需要统计出这些用户的共同好友其结果如下:[100,200] [300, 400]  //表示用户100和200的共同好友是 300,400[100,300] [200, 400, 500].........【阅读全文】

阅读(1222) | 评论(0) | 转发(0)

发布时间:2018-07-06 17:17:27

点击(此处)折叠或打开import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;i.........【阅读全文】

阅读(1244) | 评论(0) | 转发(0)

发布时间:2018-07-06 17:10:50

点击(此处)折叠或打开import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.MapWritable;import org.apache.hadoop.io.Text;.........【阅读全文】

阅读(1315) | 评论(0) | 转发(0)

发布时间:2018-07-06 10:24:49

相关性计数模式主要用来分析数据相关性的设计模式。比如根据大量用户超市购物车的商品列表就可以分析关联性,大多数用户购买了A商品的同时购买了C商品,我们可以通过分析挖掘,将商品A和C摆在一起,或者将A和C捆绑销售,提高用户的购买性 假设有如下数据: 2,3,1,4,5,2,3 1,2,5,2 4,5 1,3,4,1 3,.........【阅读全文】

阅读(1289) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册