Chinaunix首页 | 论坛 | 博客
  • 博客访问: 589038
  • 博文数量: 752
  • 博客积分: 40000
  • 博客等级: 大将
  • 技术积分: 5005
  • 用 户 组: 普通用户
  • 注册时间: 2008-10-13 14:47
文章分类

全部博文(752)

文章存档

2011年(1)

2008年(751)

我的朋友

分类:

2008-10-13 16:45:40

XML 初级教程(一)

作者:



一、XML是什么?
XML即extensibe markup language的缩写,也就是可扩展标识语言。
它是作为一种通用数据结构而出现的,尽管它曾被认为取代html。
实际上我们可以将其看作"文本数据库" 。 XML文件通常需要一个验证文件,就像数据库的字符段表一样。常用的为DTD文件,现在比较流行的为XSL文件。

二、解析XML的方法
使用C++解析XML的最大好处是速度快,特别是大量数据时。
XML不像html有固定的标记,没有固定的解析器如IE或Netscape可以解析XML真正含义。 我们需要自己编写一段程序做这样的事情。
就像我们可以用ODBC/ADO读取数据库一样,我们可以用SAX/DOM解析XML文件。

三、SAX vs DOM
SAX是基于事件驱动的, 通过判断每一行数据的类型(节点/元素/其他)而决定如何处理。DOM则对XML文件整体产生一个树状结构,很显然DOM更实用一些,因为可随时读取文档任意节点数据,但其对内存要求大一些。SAX会快一些,因为解析时只保存当前行的信息。不管用那种方法解析出的数据都需要我们决定其用途,例如一个含图形数据XML,就需要调用GDI函数根据解析出来的数据画图。

SAX简介:

	
	startDocument(); //打开XML文档;
	
	startElementz();
	//处理XML数据;
	endElement();  
	
	endDocument(); //关闭XML文档;
	
例子:
	假设XML文件,
	
	
	TurboWidget
	
	 SAX处理分析过程;
	
	StartDocument( )
	StartElement( "parts" )
	StartElement( "part" )
	Characters( "TurboWidget" )
	EndElement( "part" )
	EndElement( "parts" )
	EndDocument( )
	
DOM简介:


例子:
	IXMLDOMDocument* pDoc;//XML文档Object;
	CoCreateInstance(CLSID_DOMDocument, NULL, CLSCTX_INPROC_SERVER, 
    IID_IXMLDOMDocument, (void**)&pDoc);	 
	
	XMLDOMNode * pNode;//XML节点Object;
	pDoc->QueryInterface(IID_IXMLDOMNode,(void**)(&pNode));

数据处理(可以是递归函数):
	   GetChildItem(); //获得子节点
	   节点处理:		 
	   get_nodeName();//节点名
	   get_nodeTypeString();//节点含数据
	   get_nodeType();//节点类型
	 
四、最后提供一个DOM程序例子,该例子仅仅能生成XML的树状图,没有更多处理。 更多内容将在以后发布。

五、希望能给大家帮助,欢迎大家批评指正,具体请看源代码。使用开发包为MSXML3,当然用Apache Xerces原理也是一样的。


--------------------next---------------------

写的非常好啊,就是没有写下集!盼望着
( zt00 发表于 2007-7-3 17:55:00)
 
XML 不能存2进制数,如回车符,^_^ ( nenlong 发表于 2007-3-14 17:48:00)
 
new_cooperator
哪里有Libxml的最新For Windows版下载啊 ( sheds 发表于 2005-8-2 0:52:00)
 
楼下的弟兄 不知所云啊! ( linshaodan 发表于 2005-7-31 13:19:00)
 
faint,出了M$还是M$,M$的xml库做很好么?去看看libxml2吧,短视! ( new_cooperator 发表于 2005-7-30 10:57:00)
 
XML文件通常需要一个验证文件,就像数据库的字符段表一样。常用的为DTD文件,现在比较流行的为XSD文件。不是xsl文件,xsl文件是XML样式表文件。还有DTD只是简单的文档类型定义,真正和数据库定义字段类似的是XSD文件,叫做XML架构文件。所以这篇文章有错啊!作者还是好好检查一下再发吧!

( linshaodan 发表于 2005-7-25 3:48:00)
 
谢谢,雪中送炭呵。

一直想全免了解一下XML,感谢作者满足了我的要求。 ( vista 发表于 2005-7-24 21:48:00)
 
.......................................................

--------------------next---------------------

阅读(248) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~