按类别查询搜索结果
关于关键词 的检测结果,共 1144
【大数据】 Kafka现细节
LaoLiulaoliu | 2014-01-20 15:57:31 | 阅读(1630) | 评论(0)
文章来源:http://my.oschina.net/ielts0909/blog/94733如果你第一次看kafka的文章,请先看《分布式消息系统kafka初步》之前有人问kafka和一般的MQ之间的区别,这个问题挺难回答,我觉得不如从kafka的实现原理来分析更为透彻,这篇将依据官网上给出的design来详细的分析,kafka是如何实现其高性能、高吞吐的。这一段...【阅读全文】
LaoLiulaoliu | 2014-01-20 14:48:59 | 阅读(1690) | 评论(0)
文章来源:http://my.oschina.net/ielts0909/blog/92972终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到。从这一篇开始分布式消息系统的入门。在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题:l  我想分析一下用户行为...【阅读全文】
jiangwen127 | 2014-01-20 09:56:22 | 阅读(1830) | 评论(0)
http://in.sdo.com/?p=1410http://blog.163.com/mageng11@126/blog/static/1408083742013993236408/【阅读全文】
yangrou3 | 2014-01-16 14:57:34 | 阅读(400) | 评论(0)
橄榄油近来受到越来越多健康人士的青睐,不过中国自产的橄榄油实在少得可怜,根据中国产业研究报告网发布的数据显示,2012年中国橄榄油产量仅500多吨,九成以上的橄榄油都是依靠进口。在超市里面晃悠一圈,里面的橄榄油,很多都是以原瓶进口作招徕,但事实上是否如此呢?  
  在去年12月底的意大利橄榄油摻假事件中,意大利警方称意大利橄榄油生产商掺加来自希腊、西班牙等国的廉价橄榄油,冒充高端初榨橄榄油出售,有13家意大利最大的橄榄油制造商被卷入,其中包括一些著名品牌。这一事件不仅令中国国家质检总局于今年1月5日对此发布预警,还让很多消费者在购买橄榄油的时候都多了个心眼。

  国内橄榄油九成以上都是进口,因此业内根据橄榄油进口以后是否分装,将 其分成分装版和原装版两种。有业内人士说,原装进口是指销售的橄榄油产品在境外已经分装好,进入中国市场时,应在原包装的基础上,添加内容相对应的中文标 签,并指出是原装进口,也就是俗称的原瓶版。如果是进口原料橄榄油在中国分装,应在产品外包装上标出封装地,也就是所谓的原产分装版。根据《gb23347-2009橄 榄油、油橄榄果渣油国家标准》,如果【阅读全文】
LaoLiulaoliu | 2014-01-14 09:54:25 | 阅读(1010) | 评论(0)
文章来源:http://www.infoq.com/cn/articles/best-practices-cassandra-data-model-design-part2在第一部分中,我们介绍了一些基本实践,然后通过一个具体的例子帮助大家开启Cassandra数据模型设计之旅。你可以跳过第一部分直接阅读本篇文章,但是我推荐你看看第一篇文章中“术语和约定”部分。如果你是一个Cassandra新...【阅读全文】
LaoLiulaoliu | 2014-01-13 14:57:36 | 阅读(580) | 评论(0)
文章来源:http://www.infoq.com/cn/articles/best-practice-of-cassandra-data-model-design【编者注:InfoQ中文站获得了eBay工程师Jay Patel的授权,将会为陆续为读者呈现Cassandra数据模型设计的系列内容。】本文是Cassandra数据模型设计第一篇(全两篇),该系列文章包含了eBay使用Cassandra数据模型设计的一些...【阅读全文】
AIfresher | 2014-01-09 10:21:46 | 阅读(580) | 评论(0)
机器学习书籍推荐
Deep Learning
机器学习数学基础【阅读全文】
【大数据】 数据的演化史
LaoLiulaoliu | 2014-01-09 00:14:39 | 阅读(710) | 评论(0)
文章来源:http://www.yonghongtech.com/bigdata.html?tab=0&#bigdata_01大数据时代1.1背景工业革命之后,书籍等以文字为载体的知识大约每十年翻一番;1970年以后,知识大约每三年就翻一番;如今,全球信息总量每两年就翻一番;2010年互联网的数据量,比之前所有年份的总和还要多。现在,人类每天产生数以PB的...【阅读全文】
【大数据】 数据的冲击
Larpenteur | 2014-01-08 04:31:37 | 阅读(860) | 评论(0)
1. 充分利用大数据,并由此获得巨额的收益。Google可以称得上是精通此道的鼻祖。据说,Google每个月要处理900亿次的web搜索,为此每月需要处理的数据量高达600PB。注意:1PB=100万GB2. 搜索关键字建议,都是对庞大的数据搜索历史记录进行分析后得出的。例如:Amazon推出了商品推荐系统。3. facebook可以为用户提供类似“...【阅读全文】
Larpenteur | 2014-01-08 04:28:42 | 阅读(2690) | 评论(0)
1. 大数据产生的背景:(1)数据的爆炸式增长和社会化趋势,新摩尔定律;(2)大数据已经成为一种自然资源;(3)机器数据日益重要;(4)大数据不被利用就是成本;2. 对大数据的理解:(1)大数据比云计算更为落地;(2)大数据不仅仅是“大”;(3)软件是大数据的引擎;(4)大数据的应用不仅仅是精准营销;(...【阅读全文】
hs_xp | 2014-01-05 21:44:10 | 阅读(7440) | 评论(0)
“源码走读系列”从代码层面分析了storm的具体实现,接下来通过具体的实例来说明storm的使用。因为目前storm已经正式迁移到Apache,文章系列也由twitter storm转为apache storm.

WordCountTopology 使用storm来统计文件中的每个单词的出现次数。【阅读全文】
syn2203 | 2014-01-03 16:33:11 | 阅读(2330) | 评论(0)
1. 大数据产生的背景:(1)数据的爆炸式增长和社会化趋势,新摩尔定律;(2)大数据已经成为一种自然资源;(3)机器数据日益重要;(4)大数据不被利用就是成本;2. 对大数据的理解:(1)大数据比云计算更为落地;(2)大数据不仅仅是“大”;(3)软件是大数据的引擎;(4)大数据的应用不仅仅是精准营销;(...【阅读全文】
杨宝的小窝 | 2014-01-02 21:11:52 | 阅读(7060) | 评论(0)
1. 大数据产生的背景:(1)数据的爆炸式增长和社会化趋势,新摩尔定律;(2)大数据已经成为一种自然资源;(3)机器数据日益重要;(4)大数据不被利用就是成本;2. 对大数据的理解:(1)大数据比云计算更为落地;(2)大数据不仅仅是“大”;(3)软件是大数据的引擎;(4)大数据的应用不仅仅是精准营销;(...【阅读全文】
LaoLiulaoliu | 2014-01-02 15:54:32 | 阅读(990) | 评论(0)
这部分主要介绍 Cassandra 中数据的存储格式,包括在内存中的数据和磁盘中数据。Cassandra 的写的性能表现非常好,为什么写的性能这么好?和它的数据结构有没有关系,以及和它的写的机制又有多大的关系。同时也将分析哪些因素会影响读的性能 Cassandra 又做了哪些改进。Cassandra 的数据存储结构Cassandr...【阅读全文】
LaoLiulaoliu | 2014-01-02 15:27:50 | 阅读(1100) | 评论(0)
文章来源:https://www.ibm.com/developerworks/cn/opensource/os-cn-cassandraxu1/许 令波, Java 工程师, 淘宝网简介: 本文首先介绍了 Cassandra 服务器的配置文件各个配置项的意义,接着讨论了它的启动过程,包括 Cassandra 在启动过程中主要都完成了那些操作,为什么要...【阅读全文】
zhangzhengxing | 2013-12-28 22:11:20 | 阅读(1430) | 评论(0)
配置hosts文件建立hadoop运行账号配置ssh免密码连入下载解压hadoop配置namenode,修改site文件配置hadoop-env.sh配置masters和slaves文件向各节点复制hadoop格式化namenode启动hadoop用jdk下面的jps检验各后台进程是否启动成功【阅读全文】
【大数据】 数据相关知识
alienzf | 2013-12-25 19:59:36 | 阅读(1230) | 评论(0)
摘要:海量数据上的处理常用数据结构的使用场合以及简单原理介绍,包括Bloom filter/Hash表/bitmap/堆/倒排索引/trie字典树等。关键字:大数据处理  海量数据处理  Bloom filter/Hash表/bitmap/堆/倒排索引/trie字典树    海量数据/大数据处理,无非就是基于海量数据上的存储、处理、挖掘...【阅读全文】
yyhh118 | 2013-12-17 18:25:30 | 阅读(300) | 评论(0)
2013年,阿里巴巴开启“去IOE”运动(去除118图库IBM小型机、Oracle数据库和EMC存储)并发起轰轰烈烈118图库的上“云”运动——在今年的“双十一”活动中,天猫和淘宝近80%的商铺都已经把自己的销售管理系统转移到了云上,在去年这个比例是20%。在美国,亚马逊凭借云计算技术从IBM手中抢到中央情报局的巨额订单,根据事后透...【阅读全文】
jiongtoast | 2013-12-11 11:15:56 | 阅读(2770) | 评论(0)
Impala的设计目标、系统构成、优缺点的简单介绍。【阅读全文】
jiongtoast | 2013-12-05 11:09:28 | 阅读(670) | 评论(0)
企业的大数据项目之所以会失败,主要是因为:1、缺乏一致性。IT部门和业务部门所处的角度不同,业务部门有可能对IT部门提出的建议提出挑战。无法协调这二者达成一致,是大多数项目失败的主要原因;2、缺乏数据权限。CRM、OA、DW等各种系统的数据权限不同,如果IT部门无法获得相管数据的执行权限,项目成功无从谈起;3、缺乏专业知识。大数据对企业而言毕竟很新,企业的人才储备往往缺乏相关的专业人才。【阅读全文】