TinyXml 优秀的开源 xml 解析器-IT_Learner123-ChinaUnix博客

IT_Learner123的ChinaUnix博客

首页　| 　博文目录　| 　关于我

IT_Learner123

博客访问： 414276
博文数量： 466
博客积分： 0
博客等级：民兵
技术积分： 10
用户组：普通用户
注册时间： 2015-03-16 13:59

文章分类

全部博文（466）

游戏开发（81）
JavaScript（1）
手机开发（143）
QT（16）
美文（0）
Linux（131）
Web（20）
Java（0）
C++（0）
C（0）
OpenGL（74）
未分配的博文（0）

文章存档

2015年（466）

我的朋友

相关博文

TinyXml 优秀的开源 xml 解析器

分类： C/C++

2015-03-16 14:57:14

原文地址：TinyXml 优秀的开源 xml 解析器作者：linux_wuliqiang

读取和设置xml配置文件是最常用的操作，试用了几个C++的XML解析器，个人感觉TinyXML是使用起来最舒服的，因为它的API接口和Java的十分类似，面向对象性很好。

TinyXML是一个开源的解析XML的解析库，能够用于C++，能够在Windows或Linux中编译。这个解析库的模型通过解析XML文件，然后在内存中生成DOM模型，从而让我们很方便的遍历这棵XML树。

DOM模型即文档对象模型，是将整个文档分成多个元素（如书、章、节、段等），并利用树型结构表示这些元素之间的顺序关系以及嵌套包含关系。

如下是一个XML片段：

代码链接： TinyXml.zip

在TinyXML中，根据XML的各种元素来定义了一些类：

TiXmlBase：整个TinyXML模型的基类。

TiXmlAttribute：对应于XML中的元素的属性。

TiXmlNode：对应于DOM结构中的节点。

TiXmlComment：对应于XML中的注释

TiXmlDeclaration：对应于XML中的申明部分，即<？versiong="1.0" ?>。

TiXmlDocument：对应于XML的整个文档。

TiXmlElement：对应于XML的元素。

TiXmlText：对应于XML的文字部分

TiXmlUnknown：对应于XML的未知部分。

TiXmlHandler：定义了针对XML的一些操作。

TinyXML是个解析库，主要由DOM模型类（TiXmlBase、TiXmlNode、TiXmlAttribute、TiXmlComment、TiXmlDeclaration、TiXmlElement、TiXmlText、TiXmlUnknown）和操作类（TiXmlHandler）构成。它由两个头文件（.h文件）和四个CPP文件（.cpp文件）构成，用的时候，只要将（tinyxml.h、tinystr.h、tinystr.cpp、tinyxml.cpp、tinyxmlerror.cpp、tinyxmlparser.cpp）导入工程就可以用它的东西了。如果需要，可以将它做成自己的DLL来调用。举个例子就可以说明一切。。。

对应的XML文件：

<Persons>
    <Person ID="1">
        <name>phinecos</name>
        <age>22</age>
    </Person>
</Persons>

读写XML文件的程序代码：

#include <iostream>
#include "tinyxml.h"
#include "tinystr.h"
#include <string>
#include <windows.h>
#include <atlstr.h>
using namespace std;

CString GetAppPath()
{//获取应用程序根目录
    TCHAR modulePath[MAX_PATH];
    GetModuleFileName(NULL, modulePath, MAX_PATH);
    CString strModulePath(modulePath);
    strModulePath = strModulePath.Left(strModulePath.ReverseFind(_T('\\')));
    return strModulePath;
}

//创建xml文件,szFilePath为文件保存的路径,若创建成功返回true,否则false
bool CreateXmlFile(string& szFileName)
{
    try
    {
        //创建一个XML的文档对象。
        TiXmlDocument *myDocument = new TiXmlDocument();
        //创建一个根元素并连接。
        TiXmlElement *RootElement = new TiXmlElement("Persons");
        myDocument->LinkEndChild(RootElement);

        //创建一个Person元素并连接。
        TiXmlElement *PersonElement = new TiXmlElement("Person");
        RootElement->LinkEndChild(PersonElement);

//设置Person元素的属性。
PersonElement->SetAttribute("ID", "1");

        //创建name元素、age元素并连接。
        TiXmlElement *NameElement = new TiXmlElement("name");
        TiXmlElement *AgeElement = new TiXmlElement("age");
        PersonElement->LinkEndChild(NameElement);
        PersonElement->LinkEndChild(AgeElement);

        //设置name元素和age元素的内容并连接。
        TiXmlText *NameContent = new TiXmlText("周星星");
        TiXmlText *AgeContent = new TiXmlText("22");
        NameElement->LinkEndChild(NameContent);
        AgeElement->LinkEndChild(AgeContent);
        CString appPath = GetAppPath();
        string seperator = "\\";
        string fullPath = appPath.GetBuffer(0) +seperator+szFileName;
        myDocument->SaveFile(fullPath.c_str());//保存到文件
    }
    catch (string& e)
    {
        return false;
    }
    return true;
}

//读取Xml文件，并遍历
bool ReadXmlFile(string& szFileName)
{
    try
    {
        CString appPath = GetAppPath();
        string seperator = "\\";
        string fullPath = appPath.GetBuffer(0) +seperator+szFileName;
        //创建一个XML的文档对象。
        TiXmlDocument *myDocument = new TiXmlDocument(fullPath.c_str());
        myDocument->LoadFile();

        //获得根元素，即Persons。
        TiXmlElement *RootElement = myDocument->RootElement();
        //输出根元素名称，即输出Persons。
        cout << RootElement->Value() << endl;

//获得第一个Person节点。
TiXmlElement *FirstPerson = RootElement->FirstChildElement();

        //获得第一个Person的name节点和age节点和ID属性。
        TiXmlElement *NameElement = FirstPerson->FirstChildElement();// 结点
        TiXmlElement *AgeElement = NameElement->NextSiblingElement();//结点
        TiXmlAttribute *IDAttribute = FirstPerson->FirstAttribute();// 属性
        //输出第一个Person的name内容，即周星星；age内容，即；ID属性，即。
        cout << NameElement->FirstChild()->Value() << endl;
        cout << AgeElement->FirstChild()->Value() << endl;
        cout << IDAttribute->Value()<< endl;
    }
    catch (string& e)
    {
        return false;
    }
    return true;
}
int main()
{
    string fileName = "info.xml";
    CreateXmlFile(fileName);
    ReadXmlFile(fileName);
}

官方下载地址：

本地下载地址：http://blogimg.chinaunix.net/blog/upfile2/100811111318.zip

在TinyXML中，根据XML的各种元素来定义了一些类：
        TiXmlBase：整个TinyXML模型的基类。
        TiXmlAttribute：对应于XML中的元素的属性。
        TiXmlNode：对应于DOM结构中的节点。
        TiXmlComment：对应于XML中的注释。
        TiXmlDeclaration：对应于XML中的申明部分，即<？versiong="1.0" ?>。
        TiXmlDocument：对应于XML的整个文档。
        TiXmlElement：对应于XML的元素。
        TiXmlText：对应于XML的文字部分。
        TiXmlUnknown：对应于XML的未知部分。
        TiXmlHandler：定义了针对XML的一些操作。

例如:

<?xml version="1.0" standalone=no>
<!– Our to do list data –>
<ToDo>
<Item priority="1"> Go to the <bold>Toy store!</bold></Item>
<Item priority="2"> Do bills</Item>
</ToDo>

整个对象树：

TiXmlDocument "demo.xml"
TiXmlDeclaration "version=’1.0′" "standalone=no"
TiXmlComment " Our to do list data"
TiXmlElement "ToDo"
TiXmlElement "Item" Attribtutes: priority = 1
TiXmlText "Go to the "
TiXmlElement "bold"
TiXmlText "Toy store!"
TiXmlElement "Item" Attributes: priority=2
TiXmlText "Do bills"

在tinyXML中,用FirstChild（"名字"）查找节点时,调用FirstChild函数的节点与要查找的节点必须成“父子关系”。

句柄

想要健壮地读取一个XML文档，检查方法调用后的返回值是否为null是很重要的。一种安全的检错实现可能会产生像这样的代码：

TiXmlElement* root = document.FirstChildElement( "Document" );
if ( root )
{
TiXmlElement* element = root->FirstChildElement( "Element" );
if ( element )
{
TiXmlElement* child = element->FirstChildElement( "Child" );
if ( child )
{
TiXmlElement* child2 = child->NextSiblingElement( "Child" );
if ( child2 )
{
// Finally do something useful.

用句柄的话就不会这么冗长了，使用TiXmlHandle类，前面的代码就会变成这样：

TiXmlHandle docHandle( &document );
TiXmlElement* child2 = docHandle.FirstChild( "Document" ).FirstChild( "Element" ).Child( "Child", 1 ).ToElement();
if ( child2 )
{
// do something useful

一、读取XML,设置节点文本
如下XML片段:

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<ZXML>
    <ZAPP>
         <VBS_RUNTIME_PARAMS>
               <BROADCAST_VERSION info="版本">8</BROADCAST_VERSION>
               <Broadcast>
                <FileCount info="资源文件个数">69</FileCount>
                <SOURCE_1>
                    <ID info="图片编号">1</ID>
                    <Version info="图片版本">1</Version>
                    <Path info="图片路径">/mnt/share/1.bmp</Path>
                    <FileMode info="文件处理模式">0</FileMode>
                </SOURCE_1>
                <SOURCE_2>
                    <Path info="图片路径">/mnt/share/2.bmp</Path>
                    <ID info="图片编号">2</ID>
                    <Version info="图片版本">1</Version>
                    <FileMode info="文件处理模式">0</FileMode>
                </SOURCE_2>
                .
                </Broadcast>
         </VBS_RUNTIME_PARAMS>
    </ZAPP>
</ZXML>

要设置BROADCAST_VERSION节点的值 8为其他值,可参考如下代码(将值加1):
用ReplaceChild( TiXmlNode* replaceThis, const TiXmlNode& withThis )方法替换

TiXmlDocument doc("zapp.conf");
    doc.LoadFile();
    TiXmlHandle docHandle( &doc );
TiXmlElement* Broadcast_ver = docHandle.FirstChild("ZXML").FirstChild("ZAPP").FirstChild("VBS_RUNTIME_PARAMS").FirstChildElement("BROADCAST_VERSION").ToElement();
    TiXmlNode * oldnode = Broadcast_ver->FirstChild();
    const char *ver = Broadcast_ver->GetText();
    int oldVer = atoi(ver);
    CString newVer;
    newVer.Format("%d",oldVer+1);
    TiXmlText newText(newVer);
    Broadcast_ver->ReplaceChild(oldnode,newText);
    AfxMessageBox(Broadcast_ver->GetText());//输出值

    doc.SaveFile();

二,删除节点,属性值

RemoveChild( TiXmlNode* removeThis )方法删除父节点的子节点,
RemoveAttribute( const char * name )方法删除属性值.

例如删除BROADCAST_VERSION节点

TiXmlHandle docHandle( &doc );

TiXmlElement* Broadcast_ver = docHandle.FirstChild("ZXML").FirstChild("ZAPP").FirstChild("VBS_RUNTIME_PARAMS").ToElement();

TiXmlNode * node = Broadcast_ver->FirstChild("BROADCAST_VERSION");

Broadcast_ver->RemoveChild(node);

也可以删除整个SOURCE_1节点:

TiXmlHandle docHandle( &doc );

TiXmlElement* Broadcast = docHandle.FirstChild("ZXML").FirstChild("ZAPP").FirstChild("VBS_RUNTIME_PARAMS").FirstChild("Broadcast").ToElement();

TiXmlNode * node = Broadcast->FirstChild("SOURCE_1");

Broadcast->RemoveChild(node);

删除BROADCAST_VERSION的info属性:

TiXmlHandle docHandle( &doc );

TiXmlElement* Broadcast_ver = docHandle.FirstChild("ZXML").FirstChild("ZAPP").FirstChild("VBS_RUNTIME_PARAMS").FirstChildElement("BROADCAST_VERSION").ToElement();

Broadcast_ver->RemoveAttribute("info"); //删除info

可以借助NextSiblingElement()方法实现递归删除.

三,添加节点,属性值

例如在SOURCE_3下添加BROADCAST_PID节点:

TiXmlHandle docHandle( &doc );

TiXmlElement* Broadcast = docHandle.FirstChild("ZXML").FirstChild("ZAPP").FirstChild("VBS_RUNTIME_PARAMS").FirstChild("Broadcast").ToElement();

TiXmlElement* Broadcast_Pid = new TiXmlElement("BROADCAST_PID");

TiXmlText *text =new TiXmlText("7215");

Broadcast_Pid->SetAttribute("info","the pid");

Broadcast_Pid->LinkEndChild(text);

Broadcast->LinkEndChild(Broadcast_Pid);

将在SOURCE_3后添加新的节点:

<BROADCAST_PID info="the pid">7215BROADCAST_PID>

四,最后说一下中文乱码的问题

乱码是由于GB2312与UTF8之间转换不当造成的,tinyxml在处理UTF8本身没有问题,当你打开一个UTF8的文档,可以在加载的时候指定UTF8的方式,或者文档声明处指明的编码格式,tinyxml会按照相应的编码格式加载,但很多时候当我们输出或写入中文字段时会出现乱码,无论在内存,还是打印出来的内容.这是因为我们的软件通常是GB2312编码,而读取或写入的内容是UTF8,自然就会出错.可以借助网上的两个函数来实现转换(原作者不详):

void ConvertUtf8ToGBK(CString& strUtf8)
    {
        int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0);
        unsigned short * wszGBK = new unsigned short[len+1];
        memset(wszGBK, 0, len * 2 + 2);
        MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, wszGBK, len);

        len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);
        char *szGBK=new char[len + 1];
        memset(szGBK, 0, len + 1);
        WideCharToMultiByte (CP_ACP, 0, wszGBK, -1, szGBK, len, NULL,NULL);

        strUtf8 = szGBK;
        delete[] szGBK;
        delete[] wszGBK;
    }

    void ConvertGBKToUtf8(CString& strGBK)
    {
        int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
        unsigned short * wszUtf8 = new unsigned short[len+1];
        memset(wszUtf8, 0, len * 2 + 2);
        MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);

        len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
        char *szUtf8=new char[len + 1];
        memset(szUtf8, 0, len + 1);
        WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);

        strGBK = szUtf8;
        delete[] szUtf8;
        delete[] wszUtf8;
    }

当然,你也可以用MultiByteToWideChar,WideCharToMultiByte函数自己实现转换.以上是简单应用的几个举例,理解他们,相信你已经能写出满足自己需要的代码了.

阅读(503) | 评论(0) | 转发(0) |

上一篇：将mp3格式转换成wav格式的音频文件?

下一篇：OpenGL 绘制一个立方体（demo）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6