Chinaunix首页 | 论坛 | 博客
  • 博客访问: 545037
  • 博文数量: 302
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 4765
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-15 23:10
文章分类

全部博文(302)

文章存档

2011年(1)

2008年(301)

我的朋友

分类: 服务器与存储

2008-07-19 23:17:55

明确需求-信息收集-数据采样-清除转换-分析提炼-信息归档-信息发送-使用反馈。

  数据挖掘大体上有两种功能:预测 / 验证功能和描述功能。前者指用数据库的若干已知属性预测或验证其他未知属性值;后者指找到描述数据的可理解模式。具体地说,数据挖掘的任务主要包括:

  (1)数据分类(Classification):发现每一数据与既定类别间的映像函数的过程,在市场调查、信用评估等领域应用广泛,常用的方法有决策树、神经网络、遗传算法、Rough集等。

  (2)回归分析(Regression):发现变量和属性间的依赖关系。

  (3)聚类分析(Clustering):根据对象之间的相似性把对象分组。

  (4)概括(Summarization):寻找数据集合的描述。

  (5)构造依赖模式(Dependency Pattern):构造变量间函数依赖关系或相关关系的模型。

  (6)偏差分析(DeviationDetection):探测数据现状和历史记录或标准之间的差别,例如结果与期望的偏离,反常实例等。

中国多有哪些公司正在从事这样的工作?

阅读(1700) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~