Chinaunix首页 | 论坛 | 博客
  • 博客访问: 773069
  • 博文数量: 111
  • 博客积分: 3895
  • 博客等级: 中校
  • 技术积分: 1300
  • 用 户 组: 普通用户
  • 注册时间: 2008-03-29 21:26
文章分类

全部博文(111)

文章存档

2014年(22)

2013年(8)

2010年(14)

2009年(21)

2008年(46)

我的朋友

分类: IT业界

2014-04-16 21:49:30

  如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。本文介绍了一些大数据方面的顶级开源工具,分为四个领域:数据存储,开发平台,开发工具和集成,分析和报告工具。

  随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。

  如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。
  以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

数据存储:
    Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
    NoSql 数据库 – MongoDB, Cassandra, Hbase
    SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB

开发平台:
    Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics);Cascading(开源大数据应用程序开发框架)
    Apache Lucene和 Solr平台
    OpenStack(构建私有云和公有云)
    Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)
    REEF(微软的Hadoop开发者平台)
    Storm(集成了各种排队系统和数据库系统)

开发工具和集成:
    Apache Mahout(机器学习的编程语言)
    Python 和 R(预测分析编程语言)

分析和报告工具:
    Jaspersoft(报告和分析服务器)
    Pentaho(数据集成和业务分析)
    Splunk(IT分析平台)
    Talend(大数据集成,数据管理和应用集成)

以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

阅读(626) | 评论(0) | 转发(0) |
0

上一篇:分析mp4文件格式

下一篇:PMON学用命令

给主人留下些什么吧!~~