按类别查询搜索结果
关于关键词 的检测结果,共 435
dreamjdn | 2015-01-04 15:28:25 | 阅读(1720) | 评论(0)
早些时候写过关于购物篮分析的文章,其中提到了C5.0和Apriori算法,没有仔细说说这算法的含义,昨天写了一下关联分析的理论部分,今天说说关联分析算法之一的Apriori算法,很多时候大家都说,数据分析师更多的是会用就可以了,不必纠结于那些长篇累牍的理论,其实我觉得还是有点必要的,你未必要去设计算法,但是如果你掌...【阅读全文】
【大数据】 推荐
ai616818 | 2015-01-04 14:36:34 | 阅读(850) | 评论(0)
链接:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html【阅读全文】
蒜末 | 2015-01-04 10:32:27 | 阅读(7450) | 评论(0)
  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业...【阅读全文】
Jack201415 | 2015-01-03 06:20:33 | 阅读(310) | 评论(0)
如何把云计算大数据处理速度提高100倍以上?Spark给出了答案。Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了100倍以上,下图来自Spark的官方网站:  可以看出在Spark特别擅长的领域其速度比Hadoop快120倍以上! Spark是基于内存,是云...【阅读全文】
FineReport爱好者 | 2014-12-24 15:06:03 | 阅读(950) | 评论(0)
经过了20年的发展,房地产行业整合已成大势所趋,逐步由区域地产开发转变成为集团化的跨地区综合开发商。地产商们因势所趋,快速实现规模扩张已成为他们的必由之路。然而,对于正处于快速扩张中的房地产企业来说,能否建立一套以资源配置有效性、决策科学性为核心的经营分析决策平台,有效进行集团管控成为企业稳步发展至关重要的一环。房地产企业既要使各个区域的下属公司快速发展,又要让集团总部避免失控的风险,这个经营分析决策平台是企业能否取得成功的关键。【阅读全文】
猪猪神大侠 | 2014-12-20 10:32:07 | 阅读(4100) | 评论(0)
原文地址:http://www.wangluqing.com/2014/12/01/r-share91/问题描述:R画函数图像?解决方案:在给定函数和定义域范围内,函数curve可以画函数图像。举例说明:par(mfrow=c(1, 3))> curve(sin, -3, 3, col="red")> curve(dnorm, -3.5, 3.5, main="Std. Normal Density", col="green")> f 【阅读全文】
dxm2025 | 2014-11-14 10:25:21 | 阅读(980) | 评论(0)
缓存DNS服务器和主DNS服务器的快速搭建详解一、设定配置内容假设我们已经在网上注册了wangej.com域名,得到的IP网络是172.16.12.0/24ns服务器是:172.16.12.1www服务器:172.16.12.1,另外一个地址:172.16.12.3mail服务器:172.16.12.2ftp主机在www服务器上,即ftp为www的别名二、准备工作:这里我们使用bi...【阅读全文】
深圳法律 | 2014-11-13 10:16:13 | 阅读(220) | 评论(0)
1.鉴定 :鉴定是鉴定人运用专门知识和技能,对公安、司法机关交验的人或物进行鉴别和判定的一种活动。  2.鉴定书  鉴定人根据检验结果,运用专门知识进行分析得出的综合性判断,称为鉴定结论。鉴定人将检验结果、分析意见和鉴定结论形成的书面文书称为鉴定书。鉴定书应包括一般情况、案情介绍、病历摘要、检验结果、...【阅读全文】
lanmeibanban | 2014-11-05 17:40:27 | 阅读(35051) | 评论(1)
关键词:R 相关系数 P值 cor(), cor.test() corr.test() psych用R计算相关系数并不是什么难题,内置的cor()函数就可以计算出matrix或data frame 各列数据间的相关系数。如下:点击(此处)折叠或打开> b <- rep(1:5, 2)> a <- seq(1:100)> b <- rep(1:20, 5)...【阅读全文】
kevinandjanies | 2014-10-28 14:36:03 | 阅读(1630) | 评论(0)
win vnc 远程登录 内网 ubuntu【阅读全文】
rocky2014 | 2014-10-04 15:06:49 | 阅读(350) | 评论(0)
Spark视频第1期:Spark亚太研究院决胜云计算大数据时代:100期Spark公益大讲堂之革命Hadoop Spark把云计算大数据速度提高100倍以上【阅读全文】
【大数据】 页爬虫shell版
xdxduser | 2014-09-27 21:03:34 | 阅读(0) | 评论(0)
想法:使用wget配合参数下载几层网页,再做文字处理,提取关键字,删去无用的...curl的使用持续更新【阅读全文】
Larpenteur | 2014-07-30 09:57:23 | 阅读(850) | 评论(0)
一、简介        LevelDB是google开源的一个key-value存储引擎库,从版本1.2开始就能够支持billion级别的数据量了。LevelDB是单进程的服务,性能非常之高,在一台4个Q6600的CPU机器上,每秒钟写数据超过40w,而随机读的性能每秒钟超过10w。LevelDB采用日志式的写方式来提高写性能...【阅读全文】
lvvhebe | 2014-07-24 10:28:33 | 阅读(260) | 评论(0)
本文从外部消息在worker进程内部的转化,传递及处理过程入手,一步步分析在worker-data中的数据项存在的原因和意义。试图从代码实现的角度来回答,如果是从头开始实现worker的话,该如何来定义消息接口,如何实现各自接口上的消息处理。【阅读全文】
mingfei10 | 2014-07-17 15:39:48 | 阅读(1150) | 评论(0)
1.      GlusterFS概述GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统,具有强大的横向扩展能力,通过扩展能够支持数PB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBand RDMA网络将物理分布的存储资源聚集在一起,使用单一全局命名空间...【阅读全文】
心雨九 | 2014-06-25 11:02:20 | 阅读(1300) | 评论(0)
DevOps整合信息技术,其信息安全将是关键部分。反之,DevOps也能定位信息安全风险。【阅读全文】
Larpenteur | 2014-06-06 02:40:39 | 阅读(1880) | 评论(0)
webkit 模拟网页点击【阅读全文】
qxhgd | 2014-06-05 10:51:48 | 阅读(2430) | 评论(0)
webkit 模拟网页点击【阅读全文】
mymusise | 2014-06-04 22:41:44 | 阅读(10520) | 评论(0)
webkit 模拟网页点击【阅读全文】
laoliulaoliu | 2014-05-28 15:50:31 | 阅读(3790) | 评论(0)
文章来源:http://www.pythonclub.org/python-files/mime-type摘要 MIME是目前互联网邮件普遍采用的格式标准,本文通过对MIME邮件格式规范的分析和说明,给出了从邮件中提取其所含各种信息的基本方法。关键词 MIME、邮件、格式、信息提取MIME,英文全称为“Multipurpose Internet Mail Extensions”,...【阅读全文】