文章来源:
http://space.itpub.net/15203236/viewspace-659806 忙完毕业论文有一段时间了,现在就等着学校繁杂的审核流程结束然后毕业。我的硕士学位研究课题是关于技术中决策树算法的比较、改进及其应用,整个课题自己还是投入了大量的时间进行研究。这里给大家推荐几本数据挖掘技术方面的经典书籍,它们为我的整篇论文提供了很大的帮助。
第一本是大名鼎鼎的《Data Mining-Practical Machine Learning Tools and Techniques,
Second Edition》,这本书是由新西兰怀卡托大学计算机科学系的Ian H.Witten和Eibe
Frank两位专家集多年的研究和教学成果精心撰写而成。这本书展示了自动从数据中提取模型,然后验证这些模型的基本理论。其中第一部分解释了各种模型
(决策树、关联规则、线性模型、聚类、贝叶斯网以及神经网)及其如何在实践中运用它们。主要包括各种方法的实施步骤、所存在的缺陷以及如何评估模型的预测
质量。本书的第二部分引导读者学习并使用作者们在网站上提供的数据挖掘平台Weka(Waikato Environment for Knowledge Analysis),它的可以通过网址得
到。Weka几乎完全实现了书中介绍的所有技术,包括机器学习方法的说明性代码和实现技术。深入研究Weka源代码可以更加清晰地理解算法的实现原理和实
现逻辑。Weka提供了一个工作平台,完整、实用、高水准地实现了许多流行的学习方案,这些方案能够直接运用于实际的数据挖掘或研究领域。最后它提供了一
个Java类库形式的框架,这个框架支持机器学习的应用,乃至新的学习方案的实现。总之,Weka系统本身是一个有用并深受欢迎的工具,同时又是对本书的一个绝佳补充。
第二本是《Introduction to Data
Mining》,P.Tan、M.Steinbach和V.Kumar的这本书是继《数据挖掘:概念与技术》一书之后的另一本重要的数据挖掘著作,三位作
者都是数据挖掘方面的知名研究者。本书源自1998年春季开始在明尼苏达大学为高年级学生和研究生开设的数据挖掘课程的讲义和教学幻灯片,内容丰富,结构
紧密,更加强调如何用数据挖掘知识解决各种实际问题,更加强调所挖掘的知识模式的评估。主要涵盖五个主题:数据、分类、关联分析、聚类和异常检测。
阅读(2202) | 评论(0) | 转发(0) |