按类别查询搜索结果
关于关键词 的检测结果,共 375
jiangwen127 | 2015-06-11 15:42:16 | 阅读(0) | 评论(0)
聚类分析聚类分析和判别分析有相似的作用,都是起到分类的作用。但是,判别分析是已知分 类然后总结出判别规则,是一种有指导的学习;而聚类分析则是有了一批样本,不知道它们 的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的 观测比较接近,不同类的观测相差较多,这是...【阅读全文】
hustfxj | 2015-06-03 14:23:22 | 阅读(1760) | 评论(0)
昨日,Twitter发布了新开发的数据实时分析平台Heron,以下为官方文档摘译:我们每天在Twitter上处理着数十亿的事件。正如你猜测的那样,实时分析这些事件是一个巨大的挑战。目前,我们主要的分析平台是开源的分布式流计算系统Storm。但是随着Twitter数据规模变大和多样化,我们的需求已经发生了改变。因此,我们设计...【阅读全文】
powerful_boy | 2015-05-21 15:02:17 | 阅读(2960) | 评论(0)
Kafka(分布式消息队列)集群迁移扩容【阅读全文】
levy-linux | 2015-05-07 16:47:11 | 阅读(2780) | 评论(0)
ganglia的工作原理就不多说了,网上很多,直接进行实践环节。CentOS-6.3 系统64位监控gmetad主机和gmond客户端主机在同一台虚拟机的时候,会出现各节点不显示性能图线的情况。(实体机不会出现这样的问题)经过证明ganglia Server使用实体机,客户端虚拟机全部显示正常。安装Ganglia服务器,需要用到的软件包,如下所...【阅读全文】
mingfei10 | 2015-04-24 10:30:16 | 阅读(4460) | 评论(0)
转自:http://blog.csdn.net/liuaigui/article/details/7163482大数据时代的到来已经不可阻挡,面对数据的爆炸式增长,尤其是半结构化数据和非结构化数据,NoSQL存储系统和分布式文件系统成为了技术浪潮,得到了长足的发展。非结构化数据目前呈现更加快速的增长趋势,IDC研究报告分析指出,到2012年非结构化数据将占到数...【阅读全文】
蒜末 | 2015-04-14 09:45:13 | 阅读(6890) | 评论(0)
  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。  从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必...【阅读全文】
kokojia1 | 2015-03-28 10:09:58 | 阅读(150) | 评论(0)
想学营销,无论哪些方式和渠道,目标都是实现产品的购买转化。切记不要把传统的营销思维生搬硬套到互联网中使用。【阅读全文】
levy-linux | 2015-03-27 14:08:42 | 阅读(5470) | 评论(0)
hbase shell中运行:alter 'member', {NAME => 'address', METHOD => 'delete'}报错ERROR: org.apache.hadoop.hbase.TableNotDisabledException: org.apache.hadoop.hbase.TableNotDisabledException: member        at org.apache.hadoop.hbase.master.HMaster.checkTableModifi...【阅读全文】
蒜末 | 2015-03-16 10:20:31 | 阅读(660) | 评论(0)
  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业...【阅读全文】
【大数据】 R 版自动升级
bill_cpp | 2015-03-10 16:38:37 | 阅读(930) | 评论(0)
用R这么多年,在WINDOWS下每当有新版本时,只能手动缷载掉老版,然后安新的。下面的命令可以自动安装最近版R,不过要手动的缷载老版。install.packages("installr")library(installr)updateR() # updating R【阅读全文】
qingshanli1988 | 2015-03-06 17:11:32 | 阅读(4370) | 评论(0)

logrotate 是一个日志切分工具。一般要结合cron一起工作。
logstash 是日志集中管理工具,但输出到文件时不能自动按大小切分(目前只能按日期)【阅读全文】
微智客2 | 2015-01-30 11:04:41 | 阅读(120) | 评论(0)
去中心化时代 与微智客钱景共赢  新媒体来临,“对于碎片化”更多将作为一种社会变革的阶段进行分析和解读。 与其说移动化互联网,不如说互联网移动化,据研究表明,无线互联网超越有线互联网成为主流。人们的生活方式和时间分配也随之改变。也可以说成互联网的一次大改革。人们的生活习惯、生活方式...【阅读全文】
lanmeibanban | 2015-01-20 17:45:30 | 阅读(840) | 评论(0)
处理矩阵或者数据框时,有时会对计算每行或每列中某些数值或某一个或几个字符的个数。当该数字或字符出现一定次数后选择保留或舍弃当前行的数据。翻了半天Google终于找到两种解决方案。如下:点击(此处)折叠或打开> m <- matrix(c("a","b","c","b","b","c","c","c","a","c","c","b"), ncol=...【阅读全文】
jiangwen127 | 2015-01-19 17:58:40 | 阅读(6130) | 评论(1)
利用现有数据测试了libshorttext,准确率比liblinear要高,原因分析中TextGrocery,更好用的文本分类Python库古龙说,无论什么东西,最好的都只有一种。经历半年的文本分类实践,我们基本已断定,最好的文本分类算法就是SVM — 支持向量机。但是纵然知道了天机,新手做文本分类仍然需要学习不少东西,...【阅读全文】
jiangwen127 | 2015-01-08 14:23:31 | 阅读(1120) | 评论(0)
https://www.airpair.com/nlp/keyword-extraction-tutorialjava版的maui, python版的RAKETextRank,关键词抽取算法,类似PageRank【阅读全文】
【大数据】 推荐
ai616818 | 2015-01-04 14:36:34 | 阅读(850) | 评论(0)
链接:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html【阅读全文】
蒜末 | 2015-01-04 10:32:27 | 阅读(7450) | 评论(0)
  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业...【阅读全文】
【大数据】 (Final版)
Jack201415 | 2015-01-03 06:20:33 | 阅读(310) | 评论(0)
如何把云计算大数据处理速度提高100倍以上?Spark给出了答案。Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了100倍以上,下图来自Spark的官方网站:  可以看出在Spark特别擅长的领域其速度比Hadoop快120倍以上! Spark是基于内存,是云...【阅读全文】
FineReport爱好者 | 2014-12-24 15:06:03 | 阅读(950) | 评论(0)
经过了20年的发展,房地产行业整合已成大势所趋,逐步由区域地产开发转变成为集团化的跨地区综合开发商。地产商们因势所趋,快速实现规模扩张已成为他们的必由之路。然而,对于正处于快速扩张中的房地产企业来说,能否建立一套以资源配置有效性、决策科学性为核心的经营分析决策平台,有效进行集团管控成为企业稳步发展至关重要的一环。房地产企业既要使各个区域的下属公司快速发展,又要让集团总部避免失控的风险,这个经营分析决策平台是企业能否取得成功的关键。【阅读全文】
深圳法律 | 2014-11-26 14:21:14 | 阅读(220) | 评论(0)
 即凡年满16周岁、具有刑事责任能力的自然人均可构成。主体不能理解为在上述交通运输部门工作的一切人员,也不能理解为仅指火车、汽车、电车、船只、航空器等交通工具的驾车人员,而应理解为一切直接从事交通运输业务和保证交通运输的人员以及非交通运输人员。交通运输人员具体地说,包括以下4种从事交通运输的人员,(1)交...【阅读全文】