本书的主要目的是向读者介绍如何用R进行数据挖掘。R是一个可以自由下载的语言,它提供统计计算和绘图环境,其功能和大量的添加包使它成为一款优秀的、多个已有(昂贵)数据挖掘工具的替代软件。
数据挖掘的一个关键问题是数据量。典型的数据挖掘问题包括一个大的数据库,需要从中提取有用的信息。在本书中,我们用MySQL作为核心数据库管理系统。对多个计算机平台,MySQL也是免费的。这意味着,我们可以不用付任何费用就可以进行“重要的”数据挖掘任务。同时,我们希望说明解决方案质量上并没有任何损失。昂贵的工具并不意味着一定更好!只要你愿意花时间来学习如何应用它们,R和MySQL就是一对很难超越的工具。我们认为这是值得的,希望在读完本书之后,你也相信这点。
本书的目的不是介绍数据挖掘的各个方面。许多已有的书籍覆盖了数据挖掘领域。我们用几个案例来向读者介绍R的数据挖掘能力。显然,这几个案例不能代表我们在现实世界中碰到的所有数据挖掘问题。同时,我们给出的解决方案也不是最完全的方案。我们的目的是通过这些实际案例向读者介绍如何用R进行数据挖掘。因此,我们案例分析的目的是展示用R进行信息提取的例子,而不是提供数据挖掘的完整分析报告。它们可以作为任何数据挖掘项目的可能思路,或者作为开发数据挖掘项目解决方案的基础。
阅读(1776) | 评论(0) | 转发(0) |