基于Hadoop平台做大数据的几种应用-jiongtoast-ChinaUnix博客

jiongtoast的ChinaUnix博客

首页　| 　博文目录　| 　关于我

jiongtoast

博客访问： 59256
博文数量： 15
博客积分： 0
博客等级：民兵
技术积分： 206
用户组：普通用户
注册时间： 2013-10-23 13:47

文章分类

全部博文（15）

数据处理（0）
Impala（1）
hadoop（2）
喃喃自语（4）
Hive（8）
未分配的博文（0）

文章存档

2013年（15）

我的朋友

相关博文

基于Hadoop平台做大数据的几种应用

分类： HADOOP

2013-12-06 11:04:12

1、自己写MapReduce任务，虽然开发难度大一点，但运行效率比Pig和Hive高，像Google的PageRank排名，机器学习、推荐，全盘扫描的ETL都是这种方式的典型应用；

2、用Hive做分析，Hive的一大好处就是能使用程序员熟悉的SQL进行计算任务编写，但某些运算效率不及M/R；

3、用Pig做数据分析，Pig是Yahoo的研发成果，yahoo也希望将其推广为大数据领域内的数据分析标准，但从目前看Pig的语法尚未普及，跟Hive的问题一样，在做某些运算时效率不及M/R；

4、基于Hbase开发的系统，基本上可以达到实时分析系统的效果，但目前没有开源实现，开发成本高。

阅读(1216) | 评论(0) | 转发(0) |

上一篇：为什么多数的大数据项目都以失败告终

下一篇：Impala简介（设计目标、系统构成、优缺点）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6