按类别查询搜索结果
关于关键词 的检测结果,共 160
wsysx | 2016-01-19 13:11:33 | 阅读(1910) | 评论(0)
文章转自: http://www.cnblogs.com/panfeng412/archive/2012/12/24/applications-scenario-summary-of-compression-algorithms.htmlGZIP、LZO、Zippy/Snappy是常用的几种压缩算法,各自有其特点,因此适用的应用场景也不尽相同。这里结合相关工程实践的情况,做一次小结。压缩算法的比较以下是Google几年...【阅读全文】
jackson1668 | 2015-12-15 14:46:30 | 阅读(1080) | 评论(0)
找了一下,没什么专门的文章。所以猜测主要还是要参照统计学的基础知识。统计学中如何计算最低样本空间是有方法的。参照下面两个帖子,大概定在500就可以了。http://www.isixsigma.com/tools-templates/sampling-data/how-determine-sample-size-determining-sample-size/http://www.qualtrics.com/blog/determining-sa...【阅读全文】
【大数据】 学常用名词
jackson1668 | 2015-12-15 14:43:31 | 阅读(870) | 评论(0)
population mean 总体平均值  符号为μsample mean 样本平均值  【阅读全文】
dsheng | 2015-12-13 18:30:14 | 阅读(0) | 评论(0)
机器学习计划,记录【阅读全文】
jackson1668 | 2015-11-26 14:30:35 | 阅读(1840) | 评论(0)
聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。摘自 数据挖掘中的聚类分析研究综述 这篇论文。 1、层次...【阅读全文】
【大数据】 聚类法总结
co_最爱乔巴 | 2015-11-25 14:54:48 | 阅读(590) | 评论(0)
?聚类算法【阅读全文】
【大数据】 聚类法总结
大钟哥哥 | 2015-10-10 22:06:34 | 阅读(130) | 评论(0)
?聚类算法【阅读全文】
【大数据】 淘宝搜索法现状
jiangwen127 | 2015-09-29 16:33:29 | 阅读(0) | 评论(0)
<header class="w-1200 center" style="box-sizing:border-box;margin-left:auto;margin-right:auto;left:0px;right:0px;width:1200px;color:#434343;font-family:'Helvetica Neue', Helvetica, Arial, 'Hiragino Sans GB', STHeiti, 微软雅黑, 'Microsoft YaHei', sans-serif;font-size:13px;line-height:19.5px;white-spa...【阅读全文】
【大数据】 淘宝搜索法现状
jiangwen127 | 2015-09-29 15:42:54 | 阅读(0) | 评论(0)
<header class="w-1200 center" style="box-sizing:border-box;margin-left:auto;margin-right:auto;left:0px;right:0px;width:1200px;color:#434343;font-family:'Helvetica Neue', Helvetica, Arial, 'Hiragino Sans GB', STHeiti, 微软雅黑, 'Microsoft YaHei', sans-serif;font-size:13px;line-height:19.5px;white-spa...【阅读全文】
niao5929 | 2015-08-27 20:06:30 | 阅读(1130) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">在 Debian 中安装 OpenQRM 云计算平台</h1></div><table width="97%...【阅读全文】
zjmwqx | 2015-07-18 11:56:03 | 阅读(5480) | 评论(0)
GPU也可以做大规模的并行计算,但是对于维度很高的数据,如何处理并压缩也并不是很显然的事情,如果不处理压缩,怎么能放进多核GPU共享的显存?如果频繁在物理内存和GPU显存之间进行拷贝,瓶颈就不是计算了,而是CPU对内存的拷贝。所以对于存储密集型的计算,毫无疑问要选择分布式并行框架。随机梯度下降需要保存所有样本点...【阅读全文】
Larpenteur | 2015-06-04 06:30:53 | 阅读(1920) | 评论(0)
 LZ77算法基础介绍 我们敬佩那两个在数据压缩领域做出了杰出贡献的以色列人,因为正是他们打破了  Huffman 编码一统天下的格局,带给了我们既高效又简便的“字典模型”。至今 ,几乎我们日常使用的所有通用压缩工具,象 ARJ,PKZip,WinZip,LHArc,RAR ,GZip,ACE,ZOO,T...【阅读全文】
Larpenteur | 2015-06-04 06:30:40 | 阅读(1520) | 评论(0)
美团推荐算法实践:机器学习重排序模型成亮点 分析挖掘  林  3个月前 (01-31)  695℃  0评论作者:陈明前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。...【阅读全文】
【大数据】 top N
liuzan_abc | 2015-05-27 08:44:49 | 阅读(3210) | 评论(0)
   top n 如果是直接针对的可排序的数据集合,并且不需要二次计算的话,则全局的top n就是可以分散到局部的top n再聚合           如果数据集不是可排序的,并且也需要进行二次计算,类似按某个统计指标来取 top n,可能就不能直接用局部的top n来并行...【阅读全文】
geekerunix | 2015-05-14 11:39:46 | 阅读(820) | 评论(0)
美团推荐算法实践:机器学习重排序模型成亮点 分析挖掘  林  3个月前 (01-31)  695℃  0评论作者:陈明前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。...【阅读全文】
von_Manstein | 2015-05-10 17:43:20 | 阅读(1030) | 评论(0)
 LZ77算法基础介绍 我们敬佩那两个在数据压缩领域做出了杰出贡献的以色列人,因为正是他们打破了  Huffman 编码一统天下的格局,带给了我们既高效又简便的“字典模型”。至今 ,几乎我们日常使用的所有通用压缩工具,象 ARJ,PKZip,WinZip,LHArc,RAR ,GZip,ACE,ZOO,T...【阅读全文】
lvyilong316 | 2015-05-07 15:16:35 | 阅读(6410) | 评论(0)
 LZ77算法基础介绍 我们敬佩那两个在数据压缩领域做出了杰出贡献的以色列人,因为正是他们打破了  Huffman 编码一统天下的格局,带给了我们既高效又简便的“字典模型”。至今 ,几乎我们日常使用的所有通用压缩工具,象 ARJ,PKZip,WinZip,LHArc,RAR ,GZip,ACE,ZOO,T...【阅读全文】
蒜末 | 2015-04-14 09:45:13 | 阅读(6790) | 评论(0)
  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。  从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必...【阅读全文】
speckle | 2015-03-23 09:11:26 | 阅读(900) | 评论(0)
  def updateTableRows(tableName : String, rdd : RDD[_]){        rdd.foreachPartition(p => {        var conn:Connection = null                try{               conn ...【阅读全文】
yyqf2008 | 2015-03-15 17:14:09 | 阅读(170) | 评论(0)
大数据最先“算”中奥斯卡 分析和预测成趋势第87届奥斯卡颁奖礼22日在洛杉矶落下帷幕,如果你当时正眼巴巴盯着电视机或计算机屏幕等待评奖结果,那可有点落伍了。要知道,最早命中奥斯卡各重头奖项的,并非捧起小金人的《鸟人》导演亚历杭德罗·冈萨雷斯·伊尼亚里图,也非“影帝”埃迪·雷德梅或者“影后”朱莉安·摩尔...【阅读全文】