Chinaunix首页 | 论坛 | 博客
  • 博客访问: 239870
  • 博文数量: 108
  • 博客积分: 3045
  • 博客等级: 中校
  • 技术积分: 1162
  • 用 户 组: 普通用户
  • 注册时间: 2007-04-19 18:26
文章分类

全部博文(108)

分类: 系统运维

2007-04-24 13:57:30

下面是ontology mapping survey.ppt的部分内容
1.为什么使用本体?
为了描述数据语义(元数据)
2.为什么描述数据语义?
为了提供一种统一的方式去使得不同部分相互理解。
3.那一个数据?
任何数据(网络上的,或是合法存在的数据库)
4.本体的正式定义。
本体是知识体,它提供一个特定领域共享概念化的形式表达。
5.本体广泛用于语义网.近来本体已经变的日益普遍,在网页上他们提供注释语义.
6.本体开发的自然分布使得大量的不同本体包括相同的部分或是重叠的域.
7.为了相互理解,他们应当使用相同形式的表达共享的概念.不幸的是,同一域用相同的本体是不容易的.而且当前已显示出这些问题.本体的不同部分不能够相互理解.
8.这不是一个新问题,在联合数据库和其它的数据整合的成就中存在相同的事情.在联合数据库中是单个数据库的本地模式或是数据库群.要么提供双面的映射在彼此的数据库上,要么就是定义一个全局的模式包括其它所有的彼此间的映射.通常通过视图映射,全局是一个视图,本地的也是一个视图.
8.本体映射和模式匹配.工具:MAFRA.
本体映射是一种方法,借以两个本体概念语义的相关性,源本体实例被转化成目标本体的实体依照语义关系.
9.映射的三个尺度.探寻,表述.执行.
探寻:手动,自动或是半自动在本体间定义的关系.
     任务是找出相关的概念或属性以及他们之间的关系.
     需要自动映射:手动指定匹配模式是耗时的,错识的趋式,且是一个代价高昂的过程.这是一个高速增加的网络数据源,电子商务的整合,依次显示本体的得要作用和数据的映射."Schema Matching"是相似的并做了大量的研究。
表述:表达本体间的关系的语言.
执行:改变源实例成为目标本体的实例.
Schema Matching:
目地是提供数据库模式匹配。在两个模式中的元素匹配包括了映射符合彼此的语义。
一个特别的表述,实体关系模型,面向对象模型,XML,指示图。
映射是一套元素的映射,每一个映射指示必然的模式S1的元素被映射到正确的S2中。每一个映射可能有一个映射的表达,指明可能的关系:数亘级上的简单关系(<,>,=),函数,ER类型关系,面向集合关系,如:Concantanate(cust.FirstName,Cust.LastName)=Customer.Contact
映射操作的结果是“匹配结果”。通常他不可能被完全自动匹配,因为许多模式有语义,他们影响匹配的标准,但不是正式的表达或是文档化的。
部分映射和全映射。匹配返回“候远匹配”,用户可以接受或是拒绝。
模式的分类和匹配的方法:
instance vs Schema:考虑实例或仅考虑模式。
Element vs Structure:个别模式元素执行匹配(属性),或是执行匹配的元素的合并。
Language vs Constraint:使用原名和描述,或是关键点和关系。
Mathcing vs Cardinality:全部的匹配结果可能关系到一个或是更多个模式的元素到别一个模式。
模式级匹配器:
考虑模式信息,如,名字,描述,数据类型,关系类型(is-a,part-of),限制,和模式结构。
元素级:仅考虑模式的原子粒度元素,如:XML模式中的属性或是关系模式中的柱例
结构级:引用元素的结合匹配,在一个结构里是一起显示的。
基于语义学上的方法:
使用名字和文本去查找语义相似的模式元素。相同的名字。相同的规范名 Cname=customerName,同义词car=automobile.需要使用字典,甚至是多语言,和分类学。
同名异物homoyms被引入问题
基于限制的方法:
模式已被限制定义了数据类型,值的范围,唯一性,可选性,关系类型和基数。
相似是基于此的,不是说单独使用,但是当和其它的方法 一起使用提高了可靠性。
匹配基数:

模式匹配和本体映射的区别:
1.数据库不提供名确的语义为他们的数据,而本体是明确的且是正式的。
2.数据库模式不能共享或是重用,通常他们被定义在一个特定的数据库之上,然面本体是自然语言重用和可共享的。
3.本体开发是越来越多的分开开发。
4.数据库发展应当考虑数据每次改变的影响,在本体里面,许多知识的原始表述是非常高的或是非常复杂的:基数限制,反属性,转换属性,不相关类,类型检查限制。
5.本体映射是被认为是更可靠的。
阅读(948) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~