按类别查询搜索结果
关于关键词 的检测结果,共 390
xiexiexielei | 2015-09-30 10:37:55 | 阅读(130) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...【阅读全文】
jiangwen127 | 2015-09-28 17:37:55 | 阅读(1190) | 评论(0)
http://m.blog.csdn.net/blog/heiyeshuwu/42965693<br /><div id="header" style="width:1351px;height:32px;background-color:#AF0F17;margin-bottom:1px;font-family:Arial;white-space:normal;"><a class="home" href="http://www.csdn.net/" style="text-decoration:none;color:#FFFFFF;font-size:14px;font-weight:...【阅读全文】
jiangwen127 | 2015-09-28 17:35:42 | 阅读(1590) | 评论(0)
http://m.blog.csdn.net/blog/heiyeshuwu/42965693<br /><div id="header" style="width:1351px;height:32px;background-color:#AF0F17;margin-bottom:1px;font-family:Arial;white-space:normal;"><a class="home" href="http://www.csdn.net/" style="text-decoration:none;color:#FFFFFF;font-size:14px;font-weight:...【阅读全文】
levy-linux | 2015-09-27 11:19:08 | 阅读(5090) | 评论(0)
告警发现一个supervisor停止,重启启动服务,但无法正常运行,查看日志报错如下:<br /><br />2015-09-27 10:21:53 c.n.c.f.i.CuratorFrameworkImpl [INFO] Starting<br />2015-09-27 10:21:53 o.a.z.ZooKeeper [INFO] Initiating client connection, connectString=dn11.21.abc:2181,dn12.21.abc:2181,dn13.21.abc:2181...【阅读全文】
levy-linux | 2015-09-24 13:57:18 | 阅读(3350) | 评论(0)
ambari安装storm后,所有supervisor无法正常启动,报错如下:

Error while executing command 'start':
Traceback (most recent call last):
  File "/usr/lib/python2.6/site-packages/resource_management/libraries/script/script.py", line 123, in execute
    me...【阅读全文】
fhadmin24 | 2015-07-27 13:07:51 | 阅读(1170) | 评论(0)
<p>众所周知,java在处理数据量比较大的时候,加载到内存必然会导致内存溢出,而在一些数据处理中我们不得不去处理海量数据,在做数据处理中,我们常见的手段是分解,压缩,并行,临时文件等方法;</p><p>  例如,我们要将数据库(不论是什么数据库)的数据导出到一个文件,一般是Excel或文本格式的CSV;对于Excel来讲...【阅读全文】
mingfei10 | 2015-07-24 17:02:19 | 阅读(1390) | 评论(0)
<div class="summary" style="font-family:Helvetica, Tahoma, Arial, sans-serif;font-size:14px;white-space:normal;color:#333333;margin:0px 0px 1.5em;padding:5px 10px;background-color:#F7F7F7;"><strong>转自:<a href="http://qq85609655.iteye.com/blog/2035717">http://qq85609655.iteye.com/blog/2035717</a...【阅读全文】
niao5929 | 2015-07-13 14:43:57 | 阅读(830) | 评论(0)
虽然Hadoop在分布式数据分析方面备受关注,但是仍有一些开源软件提供了优于Hadoop平台的的优势,比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生,其是一种新生的可扩展的数据分析平台,它基于内存计算技术,所以相对于 Hadoop 的存储方法,它在性能方面更具优势。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。【阅读全文】
wuxiaobo_2009 | 2015-07-12 12:29:53 | 阅读(1250) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...【阅读全文】
fengzhanhai | 2015-07-11 21:51:34 | 阅读(5190) | 评论(0)
虽然Hadoop在分布式数据分析方面备受关注,但是仍有一些开源软件提供了优于Hadoop平台的的优势,比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生,其是一种新生的可扩展的数据分析平台,它基于内存计算技术,所以相对于 Hadoop 的存储方法,它在性能方面更具优势。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。【阅读全文】
【大数据】 熵模型
ningbohezhijun | 2015-06-17 15:47:45 | 阅读(280) | 评论(0)
    在看《统计学习方法》的最大熵模型,感觉书上讲的还没有这篇博客讲的清楚,书上有些概念细节略掉了。不过细读的话,可以发现内容基本一致,但是知道最后我还是有很多地方不懂。当然,求导什么的还是能够看懂的。但是什么凸函数什么的,确实不懂。。。

原文链接: 【阅读全文】
levy-linux | 2015-06-05 10:40:13 | 阅读(2700) | 评论(0)
Google File System中文版Google Bigtable中文版Google MapReduce中文版【阅读全文】
【大数据】 数据网站
levy-linux | 2015-06-03 17:53:06 | 阅读(0) | 评论(0)
数据仓库与数据挖掘数据仓库之路数据仓库和商业智能门户ITpub技术论坛ITpub技术论坛TT数据库TT数据库SQL教程2天SQL基础教程数据魔方淘宝数据魔方产品行业指数与数据研究中心百度数据研究中心国内最好的行业分析网站百度指数网络曝光率及用户关注度Google趋势Google指数CNZZ数据中心CNZZ行业分析艾瑞网国内首家...【阅读全文】
hustfxj | 2015-06-03 14:23:22 | 阅读(1740) | 评论(0)
昨日,Twitter发布了新开发的数据实时分析平台Heron,以下为官方文档摘译:我们每天在Twitter上处理着数十亿的事件。正如你猜测的那样,实时分析这些事件是一个巨大的挑战。目前,我们主要的分析平台是开源的分布式流计算系统Storm。但是随着Twitter数据规模变大和多样化,我们的需求已经发生了改变。因此,我们设计...【阅读全文】
【大数据】 语文病句辨析
kokojia1 | 2015-04-21 11:38:51 | 阅读(240) | 评论(0)
汉语的句子成分可以分为:主语、谓语、宾语、定语、状语,状语一般用来修饰谓语,定语一般用来修饰主语和宾语。主语、谓语、宾语又可统称为中心语,定语和 状语统称为修饰语。下面在线教育小编跟大家一起来分析以上几个考试经常考的、典型的病句类型。。下面我们先来看一下第一种典型错误—成分搭配不当。【阅读全文】
蒜末 | 2015-04-14 09:45:13 | 阅读(6850) | 评论(0)
  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。  从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必...【阅读全文】
guoyarong11 | 2015-04-10 11:10:15 | 阅读(260) | 评论(0)
      大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考吧:      1、大数据源于一个概念,但发展至今已经形成了以技术为基础的商业体系,并慢慢形成产业生态圈。这与前几年的“云计算”发展脉络如出一辙。云计算和大数据热的背后,是行业的萧条。回想十多年前IT蓬勃...【阅读全文】
ilffe | 2015-03-23 18:35:05 | 阅读(5500) | 评论(0)
机器学习方法主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习就是分类,通过已有的训练样本去训练得到一个最优模型,然后利用这个最优模型将所有输入映射为相应的输出,对于输出进行判断实现分类,这就对未知数据进行了分类。监督学习中的典型例子是KNN和SVM。无监督学习与...【阅读全文】
【大数据】 数据技术盘点
蒜末 | 2015-03-16 10:21:58 | 阅读(480) | 评论(0)
  NoSQL数据库  我们生活的时代,相对稳定的数据库市场中还在出现一些新的技术,而且在未来几年,它们会发挥作用。事实上,NoSQL数据库在一个广义上派系基础上,其本身就包含了几种技术。总体而言,他们关注关系型数据库引擎的限制,如索引、流媒体和高访问量的网站  大数据技术盘点服务。在这些领域,相较...【阅读全文】
蒜末 | 2015-03-16 10:20:31 | 阅读(660) | 评论(0)
  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业...【阅读全文】