Chinaunix首页 | 论坛 | 博客
  • 博客访问: 3004037
  • 博文数量: 523
  • 博客积分: 11908
  • 博客等级: 上将
  • 技术积分: 5475
  • 用 户 组: 普通用户
  • 注册时间: 2009-04-03 15:50
文章分类

全部博文(523)

文章存档

2019年(3)

2013年(4)

2012年(71)

2011年(78)

2010年(57)

2009年(310)

分类: 数据库开发技术

2009-09-14 17:23:40

第二章 概念

导言 

经过第一章的快速入门学习,你已经知道了是 一种能够让你自己创造标识的语言,它可以将数据与格式从网页中分开,它可以储存数据和共享数据的特性使得XML无所不能。如果你希望深入学习XML,系统 掌握XML的来龙去脉,那么我们首先还是要回到XML概念的问题上来。XML(Extensible Markup Language),一种扩展性标识 语言。"扩展性""标识""语言"。每一个词都明确的点明了XML的重要特点和功能。我们来仔细分析: 

一. 扩展性 
二. 标识 
三. 语言 
四. 结构化 
五. Meta数据 
六. 显示 
七. DOM 

一.扩展性---使用,你可以为你的文档建立自己的标记(tags)。 

的第一个词是"扩展性",这正是XML强大的功能和弹性的原因。 
在里,有许多固定的标记,我们必须记住然后使用它们,你不能使用HTML规范里没有的标记。而在中, 你能建立任何你需要的标记。你可以充分发挥你的想象力,给你的文档起一些好记的标记名称。比如,你的文档里包含一些游戏的攻略,你可以建立一个名 为的标记,然后在下再根据游戏类别建立,等标记。只要清 晰,易于理解你可以建立任何数量的标记。 

一开始你也许会不适应,因为我们在学习时,有固定的标记可以直接学习和使用;(很多人包括我自己都是边分析别人的代码和标识,边建立自己的网页),而却没有任何标记可以学,也很少有文档的标记是一模一样的。我们怎么办?呵呵,没有就自己创建呀。一旦你真正开始写XML文档,你会发现随心所欲的创造新标记也是一份很有趣的事。你可以建立有自己特色的标记,甚至建立你自己的HTML语言。 

扩展性使你有更多的选择和强大的能力,但同时也产生一个问题就是你必须学会规划。你自己要理解自己的文档,知道它由哪几部分组成,相互之间的关系和如何识别它们。 

关于建立标识还需要说明一点,标识是描述数据的类型或特性,比如,年龄,姓 名等,而不是数据的内容,比如:<10pxl>,<18>,<张三>,这些都是无用的标 记。如果你学过,你可以这样理解,标识就是一种字段名。 

二.标识---使用你可以识别文档中的元素。 

的第二个词是"标识",这表明了XML的目的是标识文档中的元素。 

不论你是,还是,标识的本质在于便于理解,如果没有标识,你的文档在计算机看来只是一个很长的字符串,每个字看起来都一样,没有重点之分。 

通过标识,你的文档才便于阅读和理解,你可以划分段落,列明标题。中,你更可以利用其扩展性 来为文档建立更合适的标识。 

不过,有一点要提醒大家注意:标识仅仅是用来识别信息,它本身并不传达信息。例如这样的代码: 

frist step 
这里表示粗体,只用来说明是用粗体来显示"frist step"字符,本身并不包含任何实际的信息,在页面上你看不到,真正传达信息的是"frist step "。 

三.语言---使用你要遵循特定的语法来标识你的文档。 

第三个词是"语言"。这表明了作为一种语言XML必须遵循一定的规则。虽然XML的扩展性允许你创建新标识,但它仍然必须遵循特定的结构,语法和明确的定义。 

在计算机领域,语言常常表示一?quot;程序语言",用来编程实现一些功能和应用,但不是所有的"语言"都是用来编程的,就只是一种用来定义标识和描述信息的语言。 

下面我们来深入了解一下应用的其本原理,可能会很枯燥,但是对于整体的理解很重要,你可以先快速过一遍,心里有一个模糊的概念,具体精髓则需要在实践中慢慢领会。

四.结构化---促使文档结构化,所有的信息按某种关系排列。 

"结构化"听起来太抽象了,我们这样理解,结构化就是为你的文档建立一个框架,就象写文章先写一个提纲。结构化使你的文档看起来不会杂乱无章,每一部分都紧密联系,形成一个整体。 

结构化有两个原则: 
1.每一部分(每一个元素)都和其他元素有关联。关联的级数就形成了结构。 
2.标识本身的含义与它描述的信息相分离。 

我们来看一个简单的例子帮助理解: 


轻松学习手册
快速入门
什么是
使用的好处

的概念
扩展性
标识


这是本文的描述文档,可以看到标识分三级关联,非常清晰: 



...



上面这样的文档结构,我们又称之为"文档树",主干是父元素,如,分支和页是子元素,如。 

五.Meta数据(Metadata)---专业的使用者会使用meta数据来工作。 

在中我们知道可以使用meta标识来定义网页的关键字,简介等,这些标识不会显示在网页中,但可以被搜索引擎搜索到,并影响搜索结果的排列顺序。 

对这一原理进行了深化和扩展,用XML,你可以描述你的信息在哪里,你可以通过meta来验证信息,执行搜索,强制显示,或者处理其他的数据。 

下面是一些 metadata在实际应用中的用途: 

1.可以验证数字签名,使在线商务的提交动作(submission)有效。 
2.可以被方便的建立索引和进行更有效搜索。 
3.可以在不同语言之间传输数据。 

W3C组织正在研究一种名为RDF(Resource Description Framework)的metadata处理方法,可以自动交换信息,W3C宣称,使用RDF配合数字签名,将使网络中存在"真实可信"的电子商务。 

六.显示 

单独用不能显示页面,我们使用格式化技术,比如或者XSL,才能显示XML标记创建的文档。 

我们在前面第一章讲到是将数据和格式分离的。XML文档本身不知道如何来显示,必须有辅助文件来帮助实现。(XML取消了所有标识,包括font,color,p等风格样式定义标识,因此XML全部是采用类似D中的方法来定义文档风格样式。),XML中用来设定显示风格样式的文件类型有: 

1.XSL 

XSL全称是Extensible Stylesheet Language(可扩展样式语言), 是将来设计文档显示样式的主要文件类型。它本身也是基于XML语言的。使用XSL,你可以灵活的设置文档显示样式,文档将自动适应任何浏览器和PDA(掌上电脑)。 

XSL也可以将转化为,那样,老的浏览器也可以浏览XML文档了。 

2. 

大家很熟悉了,全称是Cascading Style Sheets(层叠样式表),是目前用来在浏览器上显示文档的主要方法。 

3.Behaviors 

Behaviors现在还没有成为标准。它是微软的IE浏览器特有的功能,用它可以对标识设定一些有趣动作。 

七.DOM 

DOM全称是document object model(文档对象模型),DOM是用来干什么的呢?假设把你的文档看成一个单独的对象,DOM就是如何用或者对这个对象进行操作和控制的标准。 

面向对象的思想方法已经非常流行了,在编程语言(例如java,js)中,都运用面向对象的编程思想。在中,就是要将网页也作为一个对象来操作和控制,我们可以建立自己的对象和模板。与对象进行交流,如何命令对象,就要用到API。API全称Application Programming Interface,它是访问和操作对象的规则。而DOM就是一种详细描述/XML文档对象规则的API。它规定了HTML/XML文档对象的命名协定,程序模型,沟通规则等。在XML文档中,我们可以将每一个标识元素看作一个对象---它有自己的名称和属性。 

创建了标识,而DOM的作用就是告诉script如何在浏览器窗口中操作和显示这些标识 

上面我们已经简要的讲述了一些的基本原理,我们来看看它们之间的关联以及它们是如何工作的,先看这里一张图:


此主题相关图片如下:

1.描述数据类型。例如:"King lear"是一个标题元素; 
2.储存并控制元素的显示样式。例如:标题将被以18pt字体显示 
3.script脚本控制元素如何动作。例如:当一个title元素"out of stock",将被用红色显示。 
4.DOM则为脚本和对象的交流提供一个公共平台,并将结果显示在浏览器窗口。 

如果任何一个部分发生错误,都不会得到正确结果。 

好了,看到这里,我们已经对是如何工作的有一个整体的大致的概念。通过这一章的学习,我们可能感觉到XML似乎更偏向数据处理,更方便程序员学习。实际情况也是这样的,XML设计的目的就是用来方便的共享和交互数据的。下一章,我们将系统的了解关于XML的各种术语。欢迎您继续浏览。

阅读(1145) | 评论(0) | 转发(0) |
0

上一篇:初识XML

下一篇:XML术语

给主人留下些什么吧!~~