范德萨发而为
全部博文(392)
发布时间:2013-03-21 17:13:21
http://blog.sina.com.cn/s/blog_6e6ef9830101ahs9.html在Mahout_in_Action这本书中,给了一个文本的聚类实例,并提供了原始输入数据,下面结合例子说明作为聚类算法的主要应用场景 - 文本分类,对文本信息的建模也是一个常见的问题。在信息检索研究领域已经有很好的建模方式,就是信息检索领域中最常用的向量空间.........【阅读全文】
发布时间:2013-03-19 17:59:08
传统的hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别极大。从这个意义上来说,要设计一个.........【阅读全文】
发布时间:2013-02-25 15:37:15
http://hi.baidu.com/ershiyi1985/item/be2b81f32e7a2ccea935a260从www.spamhaus.org中移除垃圾邮件黑名单今天用公司的邮件服务器发送邮件给客户邮箱,发现被退信。提示如下:remote server said: 550 5.7.1 Service unavailable; Client ho.........【阅读全文】
CU博客助理2013-01-08 14:27
chinaunix网友2010-04-18 14:30
你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖