Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2461161
  • 博文数量: 392
  • 博客积分: 7040
  • 博客等级: 少将
  • 技术积分: 4138
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-17 13:03
个人简介

范德萨发而为

文章分类

全部博文(392)

文章存档

2017年(5)

2016年(19)

2015年(34)

2014年(14)

2013年(47)

2012年(40)

2011年(51)

2010年(137)

2009年(45)

发布时间:2015-01-20 17:47:26

http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html     Next: K-means Up: Flat clustering Previous: Cardinality - the number   Contents   Index Evaluation of clusteringTypic.........【阅读全文】

阅读(6185) | 评论(0) | 转发(0)

发布时间:2015-01-20 11:18:51

http://hunch.net/~active_learning/, 包含active的一些ppt和文档http://www.causality.inf.ethz.ch/activelearning.php, active learning challenge......【阅读全文】

阅读(1052) | 评论(0) | 转发(0)

发布时间:2015-01-19 17:58:40

利用现有数据测试了libshorttext,准确率比liblinear要高,原因分析中TextGrocery,更好用的文本分类Python库古龙说,无论什么东西,最好的都只有一种。经历半年的文本分类实践,我们基本已断定,最好的文本分类算法就是SVM — 支持向量机。但是纵然知道了天机,新手做文本分类仍然需要学习不少东西,.........【阅读全文】

阅读(6177) | 评论(1) | 转发(0)

发布时间:2015-01-08 14:23:31

https://www.airpair.com/nlp/keyword-extraction-tutorialjava版的maui, python版的RAKETextRank,关键词抽取算法,类似PageRank......【阅读全文】

阅读(1152) | 评论(0) | 转发(0)

发布时间:2014-11-17 20:16:15

关于卡方检验,下面这篇blog介绍的比较详细,仔细思索之后,对一些点做如下说明,个人理解:1. 关于假设“词t与类别c无关”。这个假设应该变更为“词t不是对分类有区分度的特征”,(c是一个类别,除了c之外的所有数据组成另一个类别,类似逻辑回归多分类的方法)。一个词的卡方检验值高,并不能说明词一定与t强相关,只是.........【阅读全文】

阅读(6510) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

CU博客助理2013-01-09 08:37

jiangwen127: 这个是自动推荐的吗,还是需要博主主动去推荐.....
工作人员更新

回复  |  举报

CU博客助理2013-01-08 17:27

jiangwen127: 晕,我以为是删选之后推荐到blog.chinaunix.net的首页.....
如果你有写的特别好的文章,最好是近期的,就可以到博客首页。

回复  |  举报

CU博客助理2013-01-08 14:27

jiangwen127: http://blog.chinaunix.net/uid-20761674-id-3424553.html
我推荐首页的文章怎么老是不行呢,给点意见吧.....
已经在你的首页了啊,怎么不行了?

回复  |  举报

chinaunix网友2010-04-18 19:44

你好,可不可以麻烦你加一下我的qq啊。。。有几个问题想问问。很着急啊。。谢谢噢:852476785

回复 |  删除 |  举报

chinaunix网友2010-04-18 14:30

你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖

回复 |  删除 |  举报
留言热议
请登录后留言。

登录 注册