Java中如何使用XMLDocument解析XML？-杰瑞科技汇

XMLDocument Java终极指南：从零开始掌握XML文档的解析与操作

** 本文是Java开发者处理XML文档的终极指南，我们将深入探讨org.w3c.dom.Document接口，即大家熟知的XMLDocument，通过理论结合实战的方式，详细讲解如何使用Java原生API和流行的第三方库（如JDOM、DOM4J）来创建、读取、修改和保存XML文件，无论你是刚接触XML的新手，还是希望优化现有代码的资深工程师,这篇文章都将为你提供全面且实用的知识。

（图片来源网络，侵删）

引言：为什么XMLDocument仍是Java开发中的必备技能？

在JSON大行其道的今天，你是否曾问过自己：“我们还需要学习XML吗？”

答案是肯定的，尽管JSON以其轻量级和易读性在Web API和配置文件中占据了主导地位，但XML（eXtensible Markup Language）在很多领域依然是不可或缺的技术：

企业级应用集成： 许多传统的Web服务（如SOAP）和金融、电信行业的系统接口,依然以XML作为数据交换格式。
配置文件： Spring、MyBatis等主流框架的配置文件，以及Java项目的Maven pom.xml、Gradle的构建脚本,都是基于XML的。
文档存储： 对于结构化复杂、需要自描述性的文档,XML依然是首选。

在Java生态中，处理XML最经典、最核心的方式就是使用W3C（万维网联盟）定义的DOM（Document Object Model，文档对象模型） API。org.w3c.dom.Document接口，就是我们常说的XMLDocument的源头，掌握它，你就掌握了在Java世界里操作XML的“内功心法”。

本文将带你彻底搞懂XMLDocument,让你不再为XML解析而烦恼。

（图片来源网络，侵删）

第一部分：核心概念——什么是XMLDocument？

org.w3c.dom.Document是一个接口，它代表了一个XML文档的整个逻辑结构，当解析一个XML文件后，内存中会构建一个与XML文档结构相对应的树形对象模型，这个模型的根节点就是Document对象。

XMLDocument的核心概念：

Document（文档）： 整个XML树的根,代表一个完整的XML文档。
Element（元素）： XML的基本构建块，如 <book>, <author>，每个元素都可以包含子元素、文本内容或属性。
Attr（属性）： 元素的附加信息，如 id="001"。
Text（文本）： 元素或属性中的实际文本内容。
Node（节点）： 这是一个通用接口，Document, Element, Attr, Text 等都实现了它，在DOM树中,一切都是节点。

准备工作：Java原生XML解析的“三剑客”

在使用Java原生DOM API之前,你需要了解三个核心类：

（图片来源网络，侵删）

javax.xml.parsers.DocumentBuilderFactory：用于创建DocumentBuilder的工厂。
javax.xml.parsers.DocumentBuilder：负责将XML源（文件、输入流等）解析成Document对象。
javax.xml.transform.TransformerFactory 和 javax.xml.transform.Transformer：负责将内存中的Document对象写回到XML文件或输出流。

第二部分：实战演练——XMLDocument的CRUD全操作

我们将通过一个完整的示例，演示如何对一本“图书”的XML进行增、删、改、查。

示例XML文件：`books.xml`

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
    <book id="001">
        <title>Java编程思想</title>
        <author>Bruce Eckel</author>
        <year>2007</year>
    </book>
    <book id="002">
        <title>Effective Java</title>
        <author>Joshua Bloch</author>
        <year>2025</year>
    </book>
</bookstore>

读取与解析XML

这是所有操作的第一步：将books.xml文件加载到内存中，得到一个Document对象。

import org.w3c.dom.Document;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;
public class XmlParser {
    public static void main(String[] args) {
        try {
            // 1. 创建 DocumentBuilderFactory 实例
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            // 2. 创建 DocumentBuilder 实例
            DocumentBuilder builder = factory.newDocumentBuilder();
            // 3. 解析 XML 文件，得到 Document 对象
            File xmlFile = new File("books.xml");
            Document document = builder.parse(xmlFile);
            // 4. （可选）规范化XML文档，推荐执行
            document.getDocumentElement().normalize();
            System.out.println("XML文件解析成功！根元素是: " + document.getDocumentElement().getNodeName());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

代码解读：

DocumentBuilderFactory.newInstance(): 获取一个工厂实例,这是线程安全的推荐做法。
factory.newDocumentBuilder(): 创建一个解析器。
builder.parse(xmlFile): 执行解析,核心步骤。
document.getDocumentElement().normalize(): 压缩空白节点，规范化文档树,避免后续操作出现意外。

查询XML数据

查询是XML操作中最常见的场景，我们以查找所有<book>元素及其<title>为例。

// ... 接续上面的代码，假设 document 对象已创建
// 获取所有 book 节点列表
NodeList bookList = document.getElementsByTagName("book");
System.out.println("\n--- 开始查询图书信息 ---");
for (int i = 0; i < bookList.getLength(); i++) {
    Node bookNode = bookList.item(i);
    // 确保节点是 Element 类型
    if (bookNode.getNodeType() == Node.ELEMENT_NODE) {
        Element bookElement = (Element) bookNode;
        // 获取 id 属性
        String id = bookElement.getAttribute("id");
        // 获取 title 元素的文本内容
        NodeList titleList = bookElement.getElementsByTagName("title");
        Element titleElement = (Element) titleList.item(0);
        String title = titleElement.getTextContent();
        System.out.println("图书ID: " + id + ", 标题: " + title);
    }
}

代码解读：

document.getElementsByTagName("book"): 通过标签名获取所有匹配的节点列表。
bookNode.getNodeType() == Node.ELEMENT_NODE: DOM树中可能有文本、注释等节点,需要判断我们只关心元素节点。
(Element) bookNode: 将通用的Node强制转换为Element,以便调用元素特有的方法。
bookElement.getAttribute("id"): 获取元素的属性值，Element.getTextContent()`: 获取一个节点及其所有子节点的文本内容。

创建与修改XML

我们为第一本书添加一个新标签<price>,并修改第二本书的出版年份。

// ... 接续上面的代码
System.out.println("\n--- 开始修改XML ---");
// 1. 修改第二本书的年份
Node secondBook = bookList.item(1);
if (secondBook.getNodeType() == Node.ELEMENT_NODE) {
    Element secondBookElement = (Element) secondBook;
    NodeList yearList = secondBookElement.getElementsByTagName("year");
    Element yearElement = (Element) yearList.item(0);
    yearElement.setTextContent("2025"); // 修改年份
    System.out.println("已将第二本书的年份修改为: 2025");
}
// 2. 为第一本书添加价格标签
Node firstBook = bookList.item(0);
if (firstBook.getNodeType() == Node.ELEMENT_NODE) {
    Element firstBookElement = (Element) firstBook;
    // 创建 <price> 元素
    Element priceElement = document.createElement("price");
    // 创建文本节点并添加到 priceElement
    priceElement.setTextContent("108.00");
    // 将 priceElement 添加到 firstBookElement
    firstBookElement.appendChild(priceElement);
    System.out.println("已为第一本书添加价格标签: 108.00");
}

代码解读：

document.createElement("price"): 在Document对象上创建一个新的元素节点。
document.createTextNode(...): 创建文本节点（虽然这里我们直接用了setTextContent，原理类似）。
firstBookElement.appendChild(priceElement): 将新创建的节点作为子节点添加到指定元素中。

保存XML

修改完成后，最重要的一步是将内存中的Document对象写回文件。

import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
// ... 接续上面的代码
System.out.println("\n--- 开始保存修改后的XML ---");
try {
    // 1. 创建 TransformerFactory 和 Transformer
    TransformerFactory transformerFactory = TransformerFactory.newInstance();
    Transformer transformer = transformerFactory.newTransformer();
    // 2. 设置输出格式（可选，但推荐，可以美化输出）
    transformer.setOutputProperty(javax.xml.transform.OutputKeys.INDENT, "yes");
    transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4");
    // 3. 创建 DOMSource 和 StreamResult
    DOMSource source = new DOMSource(document);
    StreamResult result = new StreamResult(new File("books_modified.xml"));
    // 4. 执行转换（写入文件）
    transformer.transform(source, result);
    System.out.println("XML文件已成功保存为 books_modified.xml");
} catch (Exception e) {
    e.printStackTrace();
}

运行后生成的 books_modified.xml 文件内容：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<bookstore>
    <book id="001">
        <title>Java编程思想</title>
        <author>Bruce Eckel</author>
        <year>2007</year>
        <price>108.00</price>
    </book>
    <book id="002">
        <title>Effective Java</title>
        <author>Joshua Bloch</author>
        <year>2025</year>
    </book>
</bookstore>

第三部分：进阶与优化——更强大的XML处理库

Java原生DOM API虽然功能强大，但代码冗长，且性能在处理大型XML文件时可能不佳，下面介绍两款业界广泛使用的第三方库,它们能极大提升你的开发效率。

JDOM (Java-oriented DOM)

JDOM是一个专门为Java设计的API，它更直观，使用了Java集合框架,代码更简洁。

Maven依赖:

<dependency>
    <groupId>org.jdom</groupId>
    <artifactId>jdom2</artifactId>
    <version>2.0.6</version>
</dependency>

使用JDOM读取XML:

import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.SAXBuilder;
import java.io.File;
import java.io.IOException;
import java.util.List;
public class JdomExample {
    public static void main(String[] args) {
        try {
            SAXBuilder builder = new SAXBuilder();
            File xmlFile = new File("books.xml");
            Document document = builder.build(xmlFile);
            Element rootElement = document.getRootElement();
            List<Element> books = rootElement.getChildren("book");
            System.out.println("--- 使用JDOM查询图书信息 ---");
            for (Element book : books) {
                String id = book.getAttributeValue("id");
                String title = book.getChildText("title"); // 直接获取子元素的文本
                System.out.println("图书ID: " + id + ", 标题: " + title);
            }
        } catch (JDOMException | IOException e) {
            e.printStackTrace();
        }
    }
}

优点： 代码更简洁，API更符合Java习惯,支持XPath等高级查询。

DOM4J

DOM4J是另一个非常流行且性能卓越的XML处理库，被认为是目前Java领域最好的XML API之一，它不仅支持DOM,还支持SAX和XPath。

Maven依赖:

<dependency>
    <groupId>org.dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>2.1.4</version>
</dependency>

使用DOM4J读取XML:

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
public class Dom4jExample {
    public static void main(String[] args) {
        try {
            SAXReader reader = new SAXReader();
            Document document = reader.read(new File("books.xml"));
            Element rootElement = document.getRootElement();
            List<Element> books = rootElement.elements("book"); // 使用elements方法
            System.out.println("--- 使用DOM4J查询图书信息 ---");
            for (Element book : books) {
                String id = book.attributeValue("id");
                String title = book.elementText("title"); // 使用elementText方法
                System.out.println("图书ID: " + id + ", 标题: " + title);
            }
        } catch (DocumentException e) {
            e.printStackTrace();
        }
    }
}

优点： 性能极佳，功能强大（深度集成了XPath），API设计优秀,社区活跃。

第四部分：总结与最佳实践

特性	Java原生DOM	JDOM	DOM4J
易用性	较低，代码繁琐	高，API直观	很高，设计优秀
性能	一般	良好	优秀
功能	基础DOM操作	支持XPath等	支持XPath、SAX等
依赖	无需额外依赖	需要JDOM库	需要DOM4J库
适用场景	简单任务、无依赖环境	快速开发、中小型XML	对性能要求高、复杂查询

最佳实践建议：

小型项目/简单任务： 如果只是偶尔处理一下简单的XML，且不想引入新依赖,可以考虑使用Java原生DOM。
快速开发/中小型XML： JDOM是一个非常好的选择，它简单易学,能显著减少代码量。
性能敏感/大型XML/复杂查询： 强烈推荐使用DOM4J，它在性能和功能上都表现出色，是处理复杂XML场景的首选，如果你需要频繁使用XPath查询,DOM4J是当之无愧的王者。

XMLDocument作为Java处理XML的核心，其重要性不言而喻，通过本文，你应该已经掌握了从基础到进阶的XML操作技能，从原生DOM的“内功”修炼，到JDOM和DOM4J的“神兵利器”，现在你已经可以根据项目需求,灵活选择最合适的工具来高效地处理XML数据了。

希望这篇文章能成为你Java XML学习路上的得力助手，如果你觉得内容有价值，欢迎点赞、收藏并转发给更多有需要的同行！

Java中如何使用XMLDocument解析XML？

XMLDocument Java终极指南：从零开始掌握XML文档的解析与操作

引言：为什么XMLDocument仍是Java开发中的必备技能？

第一部分：核心概念——什么是XMLDocument？

第二部分：实战演练——XMLDocument的CRUD全操作

示例XML文件：`books.xml`

读取与解析XML

查询XML数据

创建与修改XML

保存XML

第三部分：进阶与优化——更强大的XML处理库

JDOM (Java-oriented DOM)

DOM4J

第四部分：总结与最佳实践

99ANYc3cd6

如何用U盘安装Win7系统？

Java保留2位小数四舍五入怎么实现？

3dmax室内设计教程哪里能下载？

Python setuptools安装时遇到问题怎么办？

苹果电脑如何安装Win7系统？

Python自然语言处理如何高效处理PDF文档？

mysql-connector-java如何高效连接与使用？

python http encoding

python sift landmark

Cool Edit Pro 2.1教程怎么学？

Java synchronized 单例如何优化性能？

Python Tornado如何高效连接与操作MySQL？

eclipse python spark

java代码实现页面跳转页面跳转页面跳转

Python decode与import有何关联？

Python VSCode中Pylint如何配置与使用？

Java中如何使用XMLDocument解析XML？

XMLDocument Java终极指南：从零开始掌握XML文档的解析与操作

引言：为什么XMLDocument仍是Java开发中的必备技能？

第一部分：核心概念——什么是XMLDocument？

第二部分：实战演练——XMLDocument的CRUD全操作

示例XML文件：books.xml

读取与解析XML

查询XML数据

创建与修改XML

保存XML

第三部分：进阶与优化——更强大的XML处理库

JDOM (Java-oriented DOM)

DOM4J

第四部分：总结与最佳实践

相关推荐

Python自然语言处理如何高效处理PDF文档？

示例XML文件：`books.xml`