Chinaunix首页 | 论坛 | 博客
  • 博客访问: 61611
  • 博文数量: 25
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 364
  • 用 户 组: 普通用户
  • 注册时间: 2013-02-25 16:52
文章分类
文章存档

2013年(25)

我的朋友

分类: IT业界

2013-05-02 15:46:24

Hadoop数据处理平台的用户现在有两个更多的搜索引擎,以帮助他们通过他们的海量信息。


Hadoop的分销商MAPR集成了LucidWorks的的搜索到自己的分销。和Cloudera Hadoop的推出了其开源黑斑羚SQL搜索引擎的第一个完整版。


[安德鲁C.奥利弗回答了这个问题,每个人的心中:我应该使用哪种再用数据库?跟上InfoWorld的企业数据爆炸数码射灯管理信息超载和遵守的最 新方法。]


“使用搜索大数据的用户界面是非常有趣,非常适合利用了很多不同类型的信息,尤其是非结构化信息搜索”杰克·诺里斯说,首席营销官MAPR。“我们看到了一些真正有趣的应用程序在其核心的搜索引擎,即使一个典型的用户也不会想到,他们作为搜索引擎的驱动。”


搜索LucidWorks是开放源码的Apache Lucene的/ Solr的全文搜索引擎的商业版本。随着新MAPR集成,LucidWorks搜索可以搜索或者通过数据对HDFS(Hadoop的文件系统)或其他文件系统上的文件。


LucidWorks搜索提供快照和镜像的高可用性,并消除了许多的工作需要安装Lucene的/ Solr的从头。它也提供了更多的数据源,一个图形用户界面和一个安全框架的原生支持。


该搜索引擎可用于在一个动态的Web应用程序,包括:检索照片,广告,产品的建议,和其它信息,可用于填充的Web站点上的苍蝇。“这不是一个数据仓库的成本较低的替代品,这是关于利用新的数据源,并做一些事情,在业务上有巨大的影响,”诺里斯说。


MAPR LucidWorks的已经合作了他们的技术配对,自2011年以来,当他们形成了联合销售协议。今年早些时候,他们发布了一个连接器,可以很容易利用Lucene / Solr的MAPR Hadoop发行。


LucidWords搜索MAPR新M7分布,测试版的形式发布工作。M7版除了到支持LucidWorks搜索,已重新架构,以消除压实或后台一致性检查,超速行驶性能。


同样是在本周,Cloudera公司发布了1.0版本兼容SQL查询引擎,一个开源的Hadoop的Cloudera的Impala。SQL是数据库使用的界面语言,关系数据库管理系统(关系数据库管理系统)和数据库管理员是众所周知的。


Impala的设计更快地执行查询比Hadoop的蜂房,因为它不使用MapReduce框架,这就要求搜索结果被写入到磁盘。相反,用户可以查询在HDFS和HBase直接的数据存储。用户可以查询数据交互方式或通过批处理过程。


Cloudera的第一次发布了一个beta 版本,这款发动机去年十月。从那时起,37signals的和Expedia等公司的软件已通过测试。


黑斑羚是Cloudera的企业RTQ的核心部件(实时查询)补充包Cloudera的Hadoop平台。Impala的可以下载,不需任何费用。
阅读(1146) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~