解析XML文件-swfczm-ChinaUnix博客

swfczm的ChinaUnix博客swfczm.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

swfczm

博客访问： 183599
博文数量： 55
博客积分： 207
博客等级：入伍新兵
技术积分： 320
用户组：普通用户
注册时间： 2010-04-23 19:33

文章分类

全部博文（55）

未分配的博文（55）

文章存档

2012年（53）

2011年（2）

我的朋友

最近访客

推荐博文

解析XML文件

分类：

2012-04-26 11:44:40

原文地址：解析XML文件作者：逊云锋

动机

网游服务器端开发过程中，很多控制游戏的参数都不应该直接硬编码的。需要各种各样的配置和脚本文件，好处：

可以由策划或数值去随意修改，而不用动程序代码
配置可以动态加载，可以动态改变服务器运行中的参数，对已经发布的功能进行调整

一般，可采用：

ini配置，一般用于window下的软件，游戏客户端有时会用到。比较简单，功能有限。
Excel表格，数值策划特别喜欢用这个，可以做很多运算，生成数值，可以用VBA做更多的事情。
xml配置，对于层次比较深、结构比较复杂的数据，应该算最佳选择了。

XML(eXtensible Markup Language)是一种标记语言，用于说明数据是什么，以及携带数据信息。主要用于：

丰富文件(Rich Documents)：自定文件描述并使其更丰富
元数据(Metadata)：描述其它文件
配置文件(Configuration Files)：设定应用程序的参数

下面主要介绍一下对于xml文件作为服务器配置时候的解析方案。

问题

解析下面的XML文件：

> prop1="100" prop2="i am string", prop3="2012-01-02 23:00:00"/> id="1" prop1="100" prop2="string1"/> id="2" prop1="100" prop2="string1"/> id="3" prop1="100" prop2="string1"/> id="4" prop1="100" prop2="string1"/> prop1="100" prop2="string1"/> prop1="100" prop2="string1"/> prop1="100" prop2="string1"/> prop1="100" prop2="string1"/> >

node1 – 整个xml文件里面只有一个该节点
node2 – 有多个并且id属性可以作为它的键值，称之为节点map
node3 – 有多个名为node3的节点，但没有键值，称之为节点vector

一般的解决方案

使用XMLPaser（用libxml2封装的一个解析器）来解析（TinyXML也类似，DOM方式的都大同小异）：

XMLPaser xml; if (xml.initFile("xxx.xml")) { xmlNodePtr root = xml.getRootNode("config"); if (root) { // 解析node1的prop1和prop2属性 struct NodeConfig{ int prop1; string prop2; } config; xmlNodePtr node1 = root->getChildNode(root, "node1"); if (node1) { node1->getNodePropNum(node1, "prop1", &config.prop1, sizeof(config.prop1)); node2->getNodePropStr(node1, "prop2", config.prop2); } // 解析node2节点map struct NodeConfig{ int prop1; string prop2; }; std::map<int, NodeConfig> nodemap; xmlNodePtr node2 = root->getChildNode(root, "node2"); while (node2) { int id; NodeConfig config; node2->getNodePropNum(node2, "id", &id, sizeof(id)); node2->getNodePropNum(node2, "prop1", &config.prop1, sizeof(config.prop1)); node2->getNodePropStr(node2, "prop2", config.prop2); nodemap[id] = config; node2 = node2->getNextNode(node2, "node2"); } // 解析node3节点vector ..... } }

坏味道分析

上面的代码，有几点不足之处，列举如下：

代码重复
- 整个解析过程大同小异，一步一步遍历加载在内存中的节点树
- 节点或节点属性的名称、节点的层次结构不同的时候，就得写不同的代码，一般会采用复制代码的方式
使用不便
- 往往要写一个单件管理器，在服务器启动的时候加载该配置，然后在管理器里面把需要的数据结构都定义好
- 使用的时候，引用管理器里面的成员变量，代码既丑陋又容易出错
不安全
- 节点名称、属性名称都是字符串，拼错了，运行时会发生逻辑错误

更好的解决方案

C++的结构与XML的对应树状结构对应起来，也就是数据绑定方案（Xml Data Binding）。自己曾经实现过一个Xml Data Binding库，名为xml_parser。具体用法如下：

step1: 编写一份描述XML结构的配置文件（也是一份XML文件,xml_parser.xml）

> prop1="int" prop2="string", prop3="t_Date"/> id="int" prop1="int" prop2="string" container_="map" key_="id"/> prop1="int" prop2="string" container_="vector" /> >

step2: 生成binding类

xmlpg -f xml_paser.xml -o xml_parser.h

step3: 应用程序中使用

xml_config<xml_paser> xml; if (xml.load("xxx.xml")) { // node1的prop1和prop2属性 int prop1 = xml.node1.prop1(); string prop2 = xml.node1.prop2(); t_Date date = xml.node1.prop3(); // node2节点map for (xml_paser::Node2MapIter it = xml.node2.begin(); it != xml.node2.end(); ++ it) { int id = it->first; int prop1 = it->second.prop1(); string prop2 = it->second.prop2(); } // node3节点vector for (size_t i = 0; i < xml.node3.size(); i ++) { int prop1 = xml.node3[i].prop1(); string prop2 = xml.node3[i].prop2(); } }

更多解决方案

方式	特征	开源库
DOM(Document Object Model)	文档对象模型，整个文档就是一个根节点及其子节点构成树状，有子节点、父节点、兄弟节点访问效率较低	libxml2 Xerces-C++ TinyXML SlimXML RapidXML
SAX(Simple API for XML)	基于事件解析XML	libxml2 Xerces-C++
Data Binding	C++的结构与XML的对应树状结构对应起来，使用起来比较容易安全，C++的结构为静态的，不会因为写错节点或节点属性名称拼写错误而导致逻辑错误代码简洁、清晰访问效率高，对所为节点或节点属性的访问只是函数调用，而不像DOM方式去循环遍历整个子树的节点，做一系列字符串比较操作不足之处，结构必须已知，DOM方式则不论程序里面对应的结构，先把整个节点树加载到内存中，程序根据自己的需要去读取自己想要的节点或节点属性	CodeSynthesis XSD

XML与Excel表格做配置的比较

比较	XML	Excel表格
结构	树状的层次结构	MxN的二维数组
适用性	信息具有层次性结构复杂	有一个键值可以索引的关联数组结构结构简单配置操作比较简单
不足之处	配置起来不是那么方便，每个节点名、属性名都必须指定	添加新列的时候，不一定所有行都用到该列属性，容易导致空间的浪费

2012/04/25 21:15 于上海

阅读(1537) | 评论(0) | 转发(0) |

上一篇：TCP/UDP相关知识总汇

下一篇：让IT人士远离慢性疲劳 2

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6