范德萨发而为
全部博文(392)
发布时间:2013-09-30 16:45:33
http://blog.csdn.net/monkey_d_meng/article/details/6556295深入探讨PageRank(二):PageRank原理剖析 关于PageRank的基础知识简介请参见博文:《深入探讨PageRank(一):PageRank算法原理入门》。 一、PageRank算法的简单举例Google PageRank算法的思想精华在于:将一个网页级别/.........【阅读全文】
发布时间:2013-09-26 20:32:20
http://www.cnblogs.com/wentingtu/archive/2012/05/28/2521166.html应roger的要求,我在此总结一下graph model。推荐中对graph model的研究主要有两个方面,一个是如何构图,另一个是如何在图上做ranking。关于构图问题,取决于数据,首先考虑如果我们只有user item的数据,那么最简单的方法就是构造.........【阅读全文】
发布时间:2013-09-22 21:52:12
开方检验方法,加入某个特征词与某个分类不相关,计算实际情况与假设的开方误差,误差越大,说明该特征词和该分类的相关度越高可以看到,该方法可以计算出具体某个类别的特征词。而信息增益方法是全局的,无法判断特征词属于哪个类别转自http://www.blogjava.net/zhenandaci/archive/2008/08/31/225966.html选择和.........【阅读全文】
发布时间:2013-03-21 17:13:21
http://blog.sina.com.cn/s/blog_6e6ef9830101ahs9.html在Mahout_in_Action这本书中,给了一个文本的聚类实例,并提供了原始输入数据,下面结合例子说明作为聚类算法的主要应用场景 - 文本分类,对文本信息的建模也是一个常见的问题。在信息检索研究领域已经有很好的建模方式,就是信息检索领域中最常用的向量空间.........【阅读全文】
CU博客助理2013-01-08 14:27
chinaunix网友2010-04-18 14:30
你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖