分类: C/C++
2008-04-23 22:00:15
XML 初级教程(一)
作者:
一、XML是什么?
XML即extensibe markup language的缩写,也就是可扩展标识语言。
它是作为一种通用数据结构而出现的,尽管它曾被认为取代html。
实际上我们可以将其看作"文本数据库" 。 XML文件通常需要一个验证文件,就像数据库的字符段表一样。常用的为DTD文件,现在比较流行的为XSL文件。
二、解析XML的方法
使用C 解析XML的最大好处是速度快,特别是大量数据时。
XML不像html有固定的标记,没有固定的解析器如IE或Netscape可以解析XML真正含义。 我们需要自己编写一段程序做这样的事情。
就像我们可以用ODBC/ADO读取数据库一样,我们可以用SAX/DOM解析XML文件。
三、SAX vs DOM
SAX是基于事件驱动的, 通过判断每一行数据的类型(节点/元素/其他)而决定如何处理。DOM则对XML文件整体产生一个树状结构,很显然DOM更实用一些,因为可随时读取文档任意节点数据,但其对内存要求大一些。SAX会快一些,因为解析时只保存当前行的信息。不管用那种方法解析出的数据都需要我们决定其用途,例如一个含图形数据XML,就需要调用GDI函数根据解析出来的数据画图。
SAX简介:
startDocument(); //打开XML文档; startElementz(); //处理XML数据; endElement(); endDocument(); //关闭XML文档;例子:
假设XML文件,DOM简介:SAX处理分析过程; StartDocument( ) StartElement( "parts" ) StartElement( "part" ) Characters( "TurboWidget" ) EndElement( "part" ) EndElement( "parts" ) EndDocument( ) TurboWidget
IXMLDOMDocument* pDoc;//XML文档Object; CoCreateInstance(CLSID_DOMDocument, NULL, CLSCTX_INPROC_SERVER, IID_IXMLDOMDocument, (void**)&pDoc); XMLDOMNode * pNode;//XML节点Object; pDoc->QueryInterface(IID_IXMLDOMNode,(void**)(&pNode));
GetChildItem(); //获得子节点 节点处理: get_nodeName();//节点名 get_nodeTypeString();//节点含数据 get_nodeType();//节点类型四、最后提供一个DOM程序例子,该例子仅仅能生成XML的树状图,没有更多处理。 更多内容将在以后发布。