大数据算法,分布式技术,spark技术爱好者
发布时间:2014-04-02 17:41:14
机器学习的基本分类模型:KNN,决策树,naive bayes,逻辑回归,SVM,adaboostKNN:一种直接的学习方法,通过相似的近邻投票分类。模型不确定性有三:距离度量(相似性度量),特征权重分配,投票权重。不确定性因素很多,非常依赖训练和经验,容易发生过拟合,因为参数太多。但简单直接的方法,有时候是有奇效。在某个.........【阅读全文】
发布时间:2013-10-21 12:48:43
数学是外部世界的抽象,只有把数学的方法和真实世界联系在一起才可以真正理解背后的思想:数学本身是算法的心脏,数学建立起了外部真实世界和抽象模型的对应。数学又是我们对自然界理解的总结升华。我们对自然界的理解却又是“抽样”!所以,数学的所有模型都是通过对自然界数据的抽样,猜想,匹配到有限的几类模型中。.........【阅读全文】