范德萨发而为
全部博文(392)
发布时间:2015-01-20 11:18:51
http://hunch.net/~active_learning/, 包含active的一些ppt和文档http://www.causality.inf.ethz.ch/activelearning.php, active learning challenge......【阅读全文】
发布时间:2015-01-19 17:58:40
利用现有数据测试了libshorttext,准确率比liblinear要高,原因分析中TextGrocery,更好用的文本分类Python库古龙说,无论什么东西,最好的都只有一种。经历半年的文本分类实践,我们基本已断定,最好的文本分类算法就是SVM — 支持向量机。但是纵然知道了天机,新手做文本分类仍然需要学习不少东西,.........【阅读全文】
发布时间:2015-01-08 14:23:31
https://www.airpair.com/nlp/keyword-extraction-tutorialjava版的maui, python版的RAKETextRank,关键词抽取算法,类似PageRank......【阅读全文】
发布时间:2014-11-17 20:16:15
关于卡方检验,下面这篇blog介绍的比较详细,仔细思索之后,对一些点做如下说明,个人理解:1. 关于假设“词t与类别c无关”。这个假设应该变更为“词t不是对分类有区分度的特征”,(c是一个类别,除了c之外的所有数据组成另一个类别,类似逻辑回归多分类的方法)。一个词的卡方检验值高,并不能说明词一定与t强相关,只是.........【阅读全文】
发布时间:2014-08-22 14:09:48
http://see.stanford.edu/see/courses.aspx......【阅读全文】
CU博客助理2013-01-08 14:27
chinaunix网友2010-04-18 14:30
你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖