科技改变世界,技术改变人生。
发布时间:2016-03-23 19:14:39
开头下定语:统计学习现在市面上谈论到的数据挖掘基本上都是基于统计学习的监督学习或非监督学习问题。尤其以监督学习应用面更广。统计学习的应用分类问题:客户分类模型、异常鉴别、图像识别等标注问题:信息抽取、自然语言处理等统计学习的一般流程 得到一个有限的数据集合&nbs.........【阅读全文】
发布时间:2016-02-14 14:50:59
模型的开发周期有多个不同的阶段,从数据收集开始直到模型建立。不过,在通过探索数据来理解(变量的)关系之前,建议进行假设生成(hypothesis generation)步骤(如果想了解更多有关假设生成的内容,推荐阅读(why-and-when-is-hypothesis-generation-important)。我认为,这是预测建模过程中最被低估的一个步骤。花.........【阅读全文】
发布时间:2016-01-26 12:53:08
这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门?资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学者的角度去思考哪些资源才是最适合他们的。.........【阅读全文】
发布时间:2016-01-26 11:52:19
常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\MLRepository.htmstatlibhttp://liama.ia.ac.cn/SCILA.........【阅读全文】