Chinaunix首页 | 论坛 | 博客
  • 博客访问: 9548265
  • 博文数量: 1227
  • 博客积分: 10026
  • 博客等级: 上将
  • 技术积分: 20273
  • 用 户 组: 普通用户
  • 注册时间: 2008-01-16 12:40
文章分类

全部博文(1227)

文章存档

2010年(1)

2008年(1226)

我的朋友

分类: C/C++

2008-04-23 22:00:15

XML 初级教程(一)

作者:



一、XML是什么?
XML即extensibe markup language的缩写,也就是可扩展标识语言。
它是作为一种通用数据结构而出现的,尽管它曾被认为取代html。
实际上我们可以将其看作"文本数据库" 。 XML文件通常需要一个验证文件,就像数据库的字符段表一样。常用的为DTD文件,现在比较流行的为XSL文件。

二、解析XML的方法
使用C 解析XML的最大好处是速度快,特别是大量数据时。
XML不像html有固定的标记,没有固定的解析器如IE或Netscape可以解析XML真正含义。 我们需要自己编写一段程序做这样的事情。
就像我们可以用ODBC/ADO读取数据库一样,我们可以用SAX/DOM解析XML文件。

三、SAX vs DOM
SAX是基于事件驱动的, 通过判断每一行数据的类型(节点/元素/其他)而决定如何处理。DOM则对XML文件整体产生一个树状结构,很显然DOM更实用一些,因为可随时读取文档任意节点数据,但其对内存要求大一些。SAX会快一些,因为解析时只保存当前行的信息。不管用那种方法解析出的数据都需要我们决定其用途,例如一个含图形数据XML,就需要调用GDI函数根据解析出来的数据画图。

SAX简介:

	

	startDocument(); //打开XML文档;

	

	startElementz();

	//处理XML数据;

	endElement();  

	

	endDocument(); //关闭XML文档;

	
例子:

	假设XML文件,

	

	

	TurboWidget

	

	 SAX处理分析过程;

	

	StartDocument( )

	StartElement( "parts" )

	StartElement( "part" )

	Characters( "TurboWidget" )

	EndElement( "part" )

	EndElement( "parts" )

	EndDocument( )

	
DOM简介:


例子:

	IXMLDOMDocument* pDoc;//XML文档Object;

	CoCreateInstance(CLSID_DOMDocument, NULL, CLSCTX_INPROC_SERVER, 

    IID_IXMLDOMDocument, (void**)&pDoc);	 

	

	XMLDOMNode * pNode;//XML节点Object;

	pDoc->QueryInterface(IID_IXMLDOMNode,(void**)(&pNode));

数据处理(可以是递归函数):

	   GetChildItem(); //获得子节点

	   节点处理:		 

	   get_nodeName();//节点名

	   get_nodeTypeString();//节点含数据

	   get_nodeType();//节点类型

	 
四、最后提供一个DOM程序例子,该例子仅仅能生成XML的树状图,没有更多处理。 更多内容将在以后发布。

五、希望能给大家帮助,欢迎大家批评指正,具体请看源代码。使用开发包为MSXML3,当然用Apache Xerces原理也是一样的。

阅读(303) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~