按类别查询搜索结果
关于关键词 的检测结果,共 389
【大数据】 数据培训及交流
Junn9527 | 2014-07-11 20:05:50 | 阅读(1310) | 评论(0)
大数据的主流技术、平台及方法论培训讲师:卜晓军(行业专家)1、什么是大数据   大数据与传统数据2、大数据的应用(1)技术与工具Teradata----行业领导者;Hadoop;流计算;LDW(Logical Data Warehouse);企业级数据仓库;大数据的管理及运维;(2)Teradata大数据探索平台ASTER3、大数据项目如...【阅读全文】
jiangwen127 | 2014-07-02 18:06:31 | 阅读(48901) | 评论(0)
http://52opencourse.com斯坦福大学机器学习第六课"逻辑回归“学习笔记,本次课程主要包括7部分:1) Classification(分类)2) Hypothesis Representation3) Decision boundary(决策边界)4) Cost function(代价函数,成本函数)5) Simplified cost function and gradient descent(简化版代价函数及梯...【阅读全文】
jiangwen127 | 2014-07-02 17:07:56 | 阅读(3270) | 评论(0)
http://blog.csdn.net/zouxy09/article/details/8537620从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09        机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一...【阅读全文】
junfeng1368 | 2014-06-27 16:59:39 | 阅读(200) | 评论(0)
新华网北京6月26日电(记者胡浩)十二届全国人大常委第九次会议26日分组审议食品安全法修订草案。与会人员认为,食品安全事关重大,食品安全法修订非常必要,建议从进一步加大处罚力度、明确企业与政府的责任、倡导社会共治等方面着手,解决当前食品安全领域存在的突出问题。重典方能治乱“重典”是食品安...【阅读全文】
心雨九 | 2014-06-25 11:02:20 | 阅读(1290) | 评论(0)
DevOps整合信息技术,其信息安全将是关键部分。反之,DevOps也能定位信息安全风险。【阅读全文】
【大数据】 数据
lixin1986red | 2014-06-16 21:47:02 | 阅读(200) | 评论(0)
大数据技术如火如荼,业界和学术界都在探索,包括大量的无关人等。目前我的理解,大数据有三块:数据,系统和挖掘算法。这个顺序也是重要性从高到低的顺序。数据决定了最终结果的最大可能性,巧妇难为无米之炊。系统是可行性的根本,若是一个job跑一小时,这个工作基本上是不可忍的,非常影响做数据的工作人员的心情和生...【阅读全文】
laoliulaoliu | 2014-05-28 15:50:31 | 阅读(3790) | 评论(0)
文章来源:http://www.pythonclub.org/python-files/mime-type摘要 MIME是目前互联网邮件普遍采用的格式标准,本文通过对MIME邮件格式规范的分析和说明,给出了从邮件中提取其所含各种信息的基本方法。关键词 MIME、邮件、格式、信息提取MIME,英文全称为“Multipurpose Internet Mail Extensions”,...【阅读全文】
laoliulaoliu | 2014-05-22 18:05:20 | 阅读(740) | 评论(0)
文章来源:http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.htmlBloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。 一. 实例   为了说明Bloom Filter存在的重要意义,...【阅读全文】
laoliulaoliu | 2014-05-20 11:17:48 | 阅读(640) | 评论(0)
文章来源:http://www.cnblogs.com/gpcuster/archive/2010/03/12/1684072.htmlCassandra是一个开源的分布式数据库,结合了Dynamo的Key/Value与Bigtable的面向列的特点。Cassandra的特点如下:1.灵活的schema:不需要象数据库一样预先设计schema,增加或者删除字段非常方便(on the fly)。2.支持range...【阅读全文】
qiselin | 2014-04-28 11:25:31 | 阅读(710) | 评论(0)
大数据处理——多格式数据进行纯文本抽取和HTML转换,HYFsoft 软件程序库广泛的应用于政府、企业等各个领域的信息资源开发利用、智能搜索引擎、情报分析和服务、信息安全、企业知识门户、数字图书馆、电子商务等领域。在世界各地得到了众多知名企业的青睐。本产品在性能和质量上都得到了用户高度评价。【阅读全文】
yuanxb1985 | 2014-04-18 13:55:23 | 阅读(1610) | 评论(0)
大数据领域的顶级开源工具大集合【阅读全文】
暖流谷 | 2014-04-11 10:18:39 | 阅读(210) | 评论(0)
大数据面向业务应用 云计算面向IT管理  大数据强调非结构化数据的挖掘,云计算强调资源高效利用,一个面向业务应用,一个面向IT管理,不说风马不相及,但彼此交集并不多。  二者惊人相似之处并不在于内容,而在于其市场传播和导入过程,首先二者都是舶来品,其次在开始的时候,没有弄得明白它们...【阅读全文】
5283jhki25 | 2014-04-10 13:19:51 | 阅读(130) | 评论(0)
  在Build大会上,微软还宣布对9寸以下平板和智能手机免除系统授权费。韦伯对此表示,www.sycxfp.com,诺基亚非常欢迎这一举措,因为这消除了OEM合作伙伴进入WP阵营的障碍,会促使WP平台更加壮大。他认为,诺基亚Lumia 520在低端市场取得了巨大成功,也吸引着诸多硬件厂商加入WP阵营。  韦伯表示,Build大会发布的新...【阅读全文】
米兰街 | 2014-04-08 16:46:29 | 阅读(250) | 评论(0)
2012年《纽约时报》刊文称:“大数据时代已经降临!” 2014年,Intel、IBM、微软、阿里巴巴等行业巨头纷纷布局大数据。IDC预测2014年产生2万TB数据, 2014年大数据产值超6亿,2016年将可望突破100亿。 过去的数据量有限,近几年随着互联网、智能手机等的普及,以及电子商务、社交网络等的兴起,...【阅读全文】
5283jhki25 | 2014-04-06 22:54:36 | 阅读(130) | 评论(0)
  电信业营改增的主要变化是税率提高,有业内人士认为,电信业有可能按照基础电信服务和增值电信服务分类,分别适用11%和6%的税率,  电信业列入今年营改增的改革任务中已是无法改变的事实。今年3月,www.fzcxfp.com,国家财政部向全国人大提请的预算报告中提出,2014年要抓紧研究将电信业纳入营改增范围的政策,力...【阅读全文】
sellsteed | 2014-04-02 10:26:39 | 阅读(100) | 评论(0)
1. Consumer behaviour is the study of when,why,how and where people do or don't buy a product。用户行为一般指用户通过中间资源,购买、使用和评价某种产品的记录。同时辅以用户、资源、产品自身及环境的信息。用户行为记录一般可以表示一组属性的集合:{属性1,属性2,...,属性N}2. 用户行为分析主要是研究...【阅读全文】
Zane_Yu | 2014-03-28 22:43:25 | 阅读(1900) | 评论(0)
  第一部分、十道海量数据处理面试题  1、海量日志数据,提取出某日访问百度次数最多的那个IP。  此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。  再详细介绍下此方案:首先是这一天,并且是...【阅读全文】
mikez1026 | 2014-03-05 09:02:30 | 阅读(960) | 评论(0)
很多企业目前都面临着被认知为大数据的海量信息。大数据的巨量可能需要一些新的IT投资,诸如新的平台来存储和提供访问信息的入口,避开性能瓶颈。但是,这并不意味着IT团队需要抛开他们当前如何向用户提供关键数据的基本面。事实上,目前影响着常规数据报表工具的设计的许多相同趋势在大数据环境下也非常有用。在...【阅读全文】
ckelsel | 2014-03-04 15:50:49 | 阅读(1920) | 评论(0)
http://blog.csdn.net/mycwq/article/details/10055391游戏平台,这里指的是运营多款游戏的用户平台,类似腾讯,盛大。大多情况下游戏平台有多处地方的账号登录,如网站登录,游戏登录,应用登录等,而且在这些地方使用的账号都是通用的。所以,这就要求游戏平台必须维护账号的唯一性与一致性。通常的作法是每个游戏...【阅读全文】
2924387508 | 2014-02-18 15:32:31 | 阅读(2630) | 评论(1)
数据越来越多,传统的关系型数据库支撑不了,分布式数据仓库又非常贵。几十亿、几百亿、甚至几千亿的数据量,如何才能高效的分析?mdrill是由阿里妈妈开源的一套数据的软件,针对TB级数据量,能够仅用10台机器,达到秒级响应,数据能实时导入,可以对任意的维度进行组合与过滤。   mdrill作为数据在线分析处理软...【阅读全文】