全部博文(2759)
发布时间:2014-01-08 04:28:42
1. 大数据产生的背景:(1)数据的爆炸式增长和社会化趋势,新摩尔定律;(2)大数据已经成为一种自然资源;(3)机器数据日益重要;(4)大数据不被利用就是成本;2. 对大数据的理解:(1)大数据比云计算更为落地;(2)大数据不仅仅是“大”;(3)软件是大数据的引擎;(4)大数据的应用不仅仅是精准营销;(.........【阅读全文】
发布时间:2013-12-06 03:23:23
好久没有来写博客了,总算是忙完了,今天回到阔别已久的CU。一早来到单位,就开始着手调试同事给的新测试镜像。但是一启动就出了问题,原先调试好的分布式平台却提示了错误: Zookeeper available but no active master location found 直观的感觉是HMaster.........【阅读全文】
发布时间:2013-10-24 11:49:04
最近在做项目的过程中有一个同事推荐了mongodb,以前有听到过该数据库是分布式数据库中的一种,但是具体并不了解紧紧是知道个名字,在该周末就用了点时间,大概去了解了下。 mongodb分布式文件存储的数据库,介于关系数据库和非关系数据库之间,是非关系数据看中最丰富,最向关系数据库的一.........【阅读全文】
发布时间:2013-10-24 11:46:31
近日花时间写了一个Mongodb chunk分析脚本,主要功能就是分析分片的集合在每个片上的分布情况。Mongodb的sharding还是有一些问题,有时会由于片键选择不合理或者删除数据等情况,导致各个片上数据严重不均。Mongodb并没有提供合并chunk的功能,想要合并只能重新导入数据,这其实是个缺陷。虽然并.........【阅读全文】