分类:
2008-04-12 09:59:00
来源:IBM developerWorks 中国网站 作者:知识管理技术主管 |
我们使用 DB2 Intelligent Miner 进行关联挖掘。安装了 DB2 之后,可以通过在 SQL 语句中调用存储过程来调用这个产品。清单 3 所示的调用使用了 Intelligent Miner 提供的一个 “简单挖掘过程”。在这个调用中, 考虑共同提及的一种办法是定义一个网络或图,如果两个人在至少一个文档中被同时提到,那么在网络中就在他们之间建立链接。这个网络隐含在挖掘视图中。DB2 Intelligent Miner 的有用功能之一是能够在这个网络中寻找强连接的子图。这些子图中的人频繁地被同时提到。一个例子见 图 6,这是由 DB2 Intelligent Miner Visualization 绘制的。可以看到,通过对 IMDB 传记文档中的共同提及数据进行数据挖掘,找到了现实生活中一些著名的关联。这里采用不同的颜色表示关联的强度,橙色比白色强,白色比蓝色强。这个子图指出了披头士乐队和与他们高度相关的人。 未来的方向 |