[Android] Android XML解析学习——Dom方式 (ZT)-web

九重天websurf.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

web_surf

博客访问： 2150484
博文数量： 413
博客积分： 10926
博客等级：上将
技术积分： 3862
用户组：普通用户
注册时间： 2006-01-09 18:14

文章分类

全部博文（413）

Web Dev.（2）
Design（4）

Detailed Design（2）

Architecture（0）

UI Design（2）
Project Manageme（2）
Media（3）
Security（10）

安全产品（1）

病毒木马（1）

黑客攻防（3）

密码学（4）
Database（0）
Network Programm（6）

protocol（1）
特别收藏（2）
常用资源介绍（1）
读书（8）
健康（7）
佛法（1）
English（2）
Mobile Developme（163）

Common（1）

Mobile Misc（2）

Dopod（1）

Motorola（1）

BlackBerry（2）

OPhone（1）

iOS（30）

MID & UMPC（2）

Android（123）
Software Enginee（22）
Platforms（85）

App Dev.（22）

Fedora（1）

Ubuntu（3）

UI Program（0）

Embedded（5）

Kernel & Drive（0）

Administration（11）

Windows Mobile（3）

Symbian（25）

Windows（7）

SDL（3）

Qt（1）

Gtk+（2）

Linux（0）

Linux File Syste（2）
Programming Lang（75）

Common（1）

Algorithm（8）

XML（0）

HTML（1）

Script（0）

Assembly（7）

Python（0）

Ruby（0）

Shell（1）

Web（0）

Perl（4）

Objective-C（3）

C/C++（13）

J2ME（5）

Java（32）
未分配的博文（20）

文章存档

2015年（5）

2014年（1）

2013年（5）

2012年（6）

2011年（138）

2010年（85）

2009年（42）

2008年（46）

2007年（26）

2006年（59）

我的朋友

相关博文

[Android] Android XML解析学习——Dom方式 (ZT)

分类：嵌入式

2011-10-31 11:39:59

(From: http://blog.csdn.net/ichliebephone/article/details/5976344)

一．基础知识

在《Android XML解析学习——Sax方式》和《Android XML解析学习——Sax方式(续)》中我们学习了在Android 平台上使用SAX的方式解析XML文档的方法。除了SAX的方式，还有一种常用的为DOM（Document Object Model文档对象模型）方式。

DOM方式解析XML的过程为首先将所有 XML 文档读取到内存中，构造一个树结构，然后允许使用 DOM API 来操作整个树结构，包括遍历 XML 树、检索所需的数据等。

Android平台使用Java SDK中的API来实现DOM方式的解析，具体的方法和之前学习的使用Java SDK中的SAX方式解析XML类似，因此有了前面SAX的基础，学习DOM方式就会比较简单了。DOM 和之前的SAX 的主要差别是 API 本身的结构，SAX 由基于事件的回调集组成，边解析边产生事件从而调用事件处理器的回调函数进行处理。而DOM不是，DOM直接读取整个XML树保存为Document类，因此只需处理保存在内存中的Document对象即可，没有回调函数。

DOM解析相关的包为javax.xml.parsers和org.w3c.dom。其中javax.xml.parsers提供Document构造器工厂DocumentBuilderFactory和Document构造器DocumentBuilder，DocumentBuilderFactory实例调用newDocumentBuilder()创建构造器DocumentBuilder实例，然后该实例就可以调用parse方法来返回一个解析为Document类的实例。Document 类由表示XML文档的包含元素、属性、文本内容等的各个节点组成。因此有了Document对象后就可以按需要获取xml文档中各个子节点及其相关的值了。Document、Element、Node等各个和DOM相关的具体部分都在org.w3c.dom包中，因此和SAX类似，org.w3c.dom包是底层具体的负责DOM解析相关的内容，并且为上层javax.xml.parsers包提供DOM解析器等相关调用。

下面我们就用上面介绍的DOM方式来实现解析XML形式的USGS地震数据的Demo例子。

二．实例开发

我们要完成的效果图如下图1所示：

图1 ListView列表显示的地震数据

和上一部分Demo例子的一样，也是解析完地震数据后用ListView列表的方式显示每条地震的震级和地名信息。

新建一个Android工程AndroidXMLDemoDom。

要添加的基本内容和上一个Demo中的一样，这里就不再赘述，这次要添加的解析器新类为DomEarthquakeHandler，内容如下所示：

view plain

public class DomEarthquakeHandler {
//xml解析用到的Tag
private String kEntryElementName = "entry";
private String kLinkElementName = "link";
private String kLinkAttributeName = "href";
private String kTitleElementName = "title";
private String kUpdatedElementName = "updated";
private String kGeoRSSPointElementName = "georss:point";
private String kGeoRSSElevElementName = "georss:elev";
//用于保存xml解析获取的结果
private ArrayList earthquakeEntryList;
private EarthquakeEntry earthquakeEntry = null;
//解析xml数据
public ArrayList parse(InputStream inStream)
{
earthquakeEntryList = new ArrayList();
//创建DocumentBuilder
DocumentBuilderFactory docBFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = null;
try {
docBuilder = docBFactory.newDocumentBuilder();
} catch (ParserConfigurationException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
//解析地震数据流.
Document doc = null;
try {
doc = docBuilder.parse(inStream);
} catch (SAXException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
Element docEle = doc.getDocumentElement();
// Get a list of each earthquake entry.
NodeList nList = docEle.getElementsByTagName(kEntryElementName);
if(nList != null && nList.getLength() > 0)
{
for(int i=0; i < nList.getLength(); i++)
{
try {
Element entry = (Element)nList.item(i);
Element title = (Element)entry.getElementsByTagName(kTitleElementName).item(0);
Element when = (Element)entry.getElementsByTagName(kUpdatedElementName).item(0);
Element gpoint = (Element)entry.getElementsByTagName(kGeoRSSPointElementName).item(0);
Element gelev = (Element)entry.getElementsByTagName(kGeoRSSElevElementName).item(0);
Element link = (Element)entry.getElementsByTagName(kLinkElementName).item(0);
String details = title.getFirstChild().getNodeValue();
String point = gpoint.getFirstChild().getNodeValue();
String elevS = gelev.getFirstChild().getNodeValue();
String date = when.getFirstChild().getNodeValue();
//获取link链接
String webLink = link.getAttribute(kLinkAttributeName);
// Log.v("Dom", webLink);
//构造更新时间
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd'T'hh:mm:ss'Z'");
Date qdate = new GregorianCalendar(0,0,0).getTime();
try {
qdate = sdf.parse(date);
} catch (ParseException e) {
e.printStackTrace();
}
//提取经纬度信息
String[] latLongitude = point.split(" ");
Location location = new Location("dummyGPS");
location.setLatitude(Double.parseDouble(latLongitude[0]));
location.setLongitude(Double.parseDouble(latLongitude[1]));
//提取强度信息
String magnitudeString = details.split(" ")[1];
int end = magnitudeString.length()-1;
double magnitude = Double.parseDouble(magnitudeString.substring(0, end));
//提取位置信息
String place = details.split(",")[1].trim();
//提取海拔高度信息
double evel;
//因为USGS数据有可能会输错，比如为"--10000"，多了一个"-"号
try {
evel = Double.parseDouble(elevS);
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
evel = 0;
}
Log.v("Dom_Elev", String.valueOf(evel));
earthquakeEntry = new EarthquakeEntry(qdate, place, webLink, location, magnitude, evel);
earthquakeEntryList.add(earthquakeEntry);
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
Log.v("Dom", "End");
return earthquakeEntryList;
}
}

程序首先也是定义解析时需要用到的元素Tag名称变量，其中因为DOM没有像SAX方式那样可以把一个元素的的名称分开为表示名称空间的Uri和当前标签名的localname，只是通过getElementsByTagName方法由完整的名称读取，因此需要定义完整的元素标签名称：

view plain

private String kGeoRSSPointElementName = "georss:point";
private String kGeoRSSElevElementName = "georss:elev";

在定义的用于解析xml数据的方法中

public ArrayList parse(InputStream inStream)

使用工厂类创建Document构造器DocumentBuilder:

view plain

//创建DocumentBuilder
DocumentBuilderFactory docBFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = null;
try {
docBuilder = docBFactory.newDocumentBuilder();
} catch (ParserConfigurationException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}

然后调用DocumentBuilder实例的parse方法解析xml文档数据并返回Document对象，并通过getDocumentElement()方法获取文档的根元素。

view plain

//解析地震数据流.
Document doc = null;
try {
doc = docBuilder.parse(inStream);
} catch (SAXException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
Element docEle = doc.getDocumentElement();

有了XML文档的根元素，就可以通过getElementsByTagName等方法获取具体的子元素，及子节点和节点值等。具体方法可以参考以上的代码。

最后添加AndroidXMLDemoDom.java文件中的内容，内容和前一个Demo工程AndroidXMLDemoSaxII中的AndroidXMLDemoSaxII.java基本一样，

view plain

public class AndroidXMLDemoDom extends Activity {
/** Called when the activity is first created. */
//定义显示的List相关变量
ListView list;
ArrayAdapter adapter;
ArrayList earthquakeEntryList;
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.main);
//获取地震数据流
InputStream earthquakeStream = readEarthquakeDataFromFile();
//Dom方式进行xml解析
DomEarthquakeHandler domHandler = new DomEarthquakeHandler();
earthquakeEntryList = domHandler.parse(earthquakeStream);
//用ListView进行显示
list = (ListView)this.findViewById(R.id.list);
adapter = new ArrayAdapter(this, android.R.layout.simple_list_item_1, earthquakeEntryList);
list.setAdapter(adapter);
}
private InputStream readEarthquakeDataFromFile()
{
//从本地获取地震数据
InputStream inStream = null;
try {
inStream = this.getAssets().open("USGS_Earthquake_1M2_5.xml");
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return inStream;
}
private InputStream readEarthquakeDataFromInternet()
{
//从网络上获取实时地震数据
URL infoUrl = null;
InputStream inStream = null;
try {
infoUrl = new URL("");
URLConnection connection = infoUrl.openConnection();
HttpURLConnection httpConnection = (HttpURLConnection)connection;
int responseCode = httpConnection.getResponseCode();
if(responseCode == HttpURLConnection.HTTP_OK)
{
inStream = httpConnection.getInputStream();
}
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return inStream;
}
}

只是把进行XML解析的部分换成了如下方式：

view plain

//Dom方式进行xml解析
DomEarthquakeHandler domHandler = new DomEarthquakeHandler();
earthquakeEntryList = domHandler.parse(earthquakeStream);

完成了，可以保存运行看下效果。

这样我们就已经学习了Android上使用SAX和DOM两种方式解析XML的方法，下面我们简单总结比较一下两者的区别。

DOM解析器是通过将XML文档解析成树状模型并将其放入内存来完成解析工作的，而后对文档的操作都是在这个树状模型上完成的。这个在内存中的文档树将是文档实际大小的几倍。这样做的好处是结构清除、操作方便，而带来的麻烦就是极其耗费系统资源。而SAX正好克服了DOM的缺点。SAX解析器的处理过程是通读整个文档，根据文档内容产生事件，而把对这些事件的处理交由事件处理器处理。SAX不需要在内存中保存整个文档，它对系统资源的节省是显而易见的。这样在一些需要处理大型XML文档和性能要求比较高的场合就要用SAX了。

我们以表格的形式看一下他们在一些方面的比较：

SAX	DOM
顺序读入文档并产生相应事件，可以处理任何大小的XML文档	在内存中创建文档树，不适于处理大型XML文档
只能对文档按顺序解析一遍，不支持对文档的随意访问	可以随意访问文档树的任何部分，没有次数限制
只能读取XML文档内容，而不能修改	可以随意修改文档树，从而修改XML文档
开发上比较复杂，需要自己来实现事件处理器	易于理解，易于开发

通过比较我们可以知道SAX和DOM各自适合的场合：

SAX适于处理下面的问题：

1. 对大型文档进行处理

2. 只需要文档的部分内容，或者只需要从文档中得到特定信息

DOM适合处理下面的问题：

1. 需要对文档进行修改

2. 需要随机对文档进行访问

以上只是对SAX和DOM方式传统的比较，而对具体的在Android平台上使用来说，因为DOM更加占用内存，而对运行在移动设备上的Android系统来说往往内存是一个比较稀缺的资源，因此除非XML 文档始终保持很小的大小，否则相对来说推荐在Android 应用程序中使用SAX 方式解析XML 。并且Android系统为SAX还提供了额外的实用工具android.util.Xml和特有的包android.sax等，因此实际上在Android使用SAX也一样很方便了。

三．总结

在这部分中我们学习了使用DOM方式解析XML的方法，并且比较了DOM方式和SAX方式的各种特点及区别。

从以上的学习我们知道Android平台已经为XML的解析提供了强大的功能，既可以使用Java SDK中的SAX和DOM方式来解析，还可以使用Android SDK提供的SAX方式。但Android平台上还有一种解析XML的方式，就是使用Pull解析器，这部分内容我们以后接着学习。

注：

参考资料：http://www.ibm.com/developerworks/cn/xml/x-jaxp/

阅读(1253) | 评论(0) | 转发(0) |

上一篇：[Android] Android XML解析学习——创建XML(ZT)

下一篇：[Android] Android XML解析学习——Sax方式 (ZT)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6