Python利用ElementTree模块处理XML的方法详解
发布时间 - 2026-01-11 03:02:41 点击率:次前言

最近因为工作的需要,在使用 Python 来发送 SOAP 请求以测试 Web Service 的性能,由于 SOAP 是基于 XML 的,故免不了需要使用 python 来处理 XML 数据。在对比了几种方案后,最后选定使用 xml.etree.ElementTree 模块来实现。
这篇文章记录了使用 xml.etree.ElementTree 模块常用的几个操作,也算是总结一下,免得以后忘记了。分享出来也方法需要的朋友们参考学习,下面话不多说了,来一起看看详细的介绍吧。
概述
对比其他 Python 处理 XML 的方案,xml.etree.ElementTree 模块(下文我们以 ET 来表示)相对来说比较简单,接口也较友好。
官方文档 里面对 ET 模块进行了较为详细的描述,总的来说,ET 模块可以归纳为三个部分:ElementTree类,Element类以及一些操作 XML 的函数。
XML 可以看成是一种树状结构,ET 使用ElementTree类来表示整个 XML 文档,使用Element类来表示 XML 的一个结点。对整 XML 文档的操作一般是对ElementTree对象进行,而对 XML 结点的操作一般是对Element对象进行。
解析 XML 文件
ET 模块支持从一个 XML 文件构造ElementTree对象,例如我们的 XML 文件example.xml内容如下(下文会继续使用这个 XML 文档):
<?xml version="1.0" encoding="utf-8"?> <data> <country name="Liechtenstein"> <rank>1</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name="Singapore"> <rank>4</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N"/> </country> </data>
可以使用 ET 模块的parse()函数来从指定的 XML 文件构造一个ElementTree对象:
import xml.etree.ElementTree as ET
# 获取 XML 文档对象 ElementTree
tree = ET.parse('example.xml')
# 获取 XML 文档对象的根结点 Element
root = tree.getroot()
# 打印根结点的名称
print root.tag
从 XML 文件构造好ElementTree对象后,还可以获取其结点,或者再继续对结点进行进一步的操作。
解析 XML 字符串
ET 模块的fromstring()函数提供从 XML 字符串构造一个Element对象的功能。
xml_str = ET.tostring(root) print xml_str root = ET.fromstring(xml_str) print root.tag
接着上面的代码,我们使用 ET 模块的tostring()函数来将上面我们构造的root对象转化为字符串,然后使用fromstring()函数重新构造一个Element对象,并赋值给root变量,这时root代表整个 XML 文档的根结点。
构造 XML
如果我们需要构造 XML 文档,可以使用 ET 模块的 Element类以及SubElement()函数。
可以使用Element类来生成一个Element对象作为根结点,然后使用ET.SubElement()函数生成子结点。
a = ET.Element('a')
b = ET.SubElement(a, 'b')
b.text = 'leehao.me'
c = ET.SubElement(a, 'c')
c.attrib['greeting'] = 'hello'
d = ET.SubElement(a, 'd')
d.text = 'www.leehao.me'
xml_str = ET.tostring(a, encoding='UTF-8')
print xml_str
输出:
<?xml version='1.0' encoding='UTF-8'?> <a><b>leehao.me</b><c greeting="hello" /><d>www.leehao.me</d></a>
如果需要输出到文件中,可以继续使用ElementTree.write()方法来处理:
# 先构造一个 ElementTree 以便使用其 write 方法
tree = ET.ElementTree(a)
tree.write('a.xml', encoding='UTF-8')
执行后,便会生成一个 XML 文件a.xml:
<?xml version='1.0' encoding='UTF-8'?> <a><b>leehao.me</b><c greeting="hello" /><d>www.leehao.me</d></a>
XML 结点的查找与更新
1. 查找 XML 结点
Element类提供了Element.iter()方法来查找指定的结点。Element.iter()会递归查找所有的子结点,以便查找到所有符合条件的结点。
# 获取 XML 文档对象 ElementTree
tree = ET.parse('example.xml')
# 获取 XML 文档对象的根结点 Element
root = tree.getroot()
# 递归查找所有的 neighbor 子结点
for neighbor in root.iter('neighbor'):
print neighbor.attrib
输出:
{'direction': 'E', 'name': 'Austria'}
{'direction': 'W', 'name': 'Switzerland'}
{'direction': 'N', 'name': 'Malaysia'}
如果使用Element.findall()或者Element.find()方法,则只会从结点的直接子结点中查找,并不会递归查找。
for country in root.findall('country'):
rank = country.find('rank').text
name = country.get('name')
print name, rank
输出:
Liechtenstein 1 Singapore 4
2. 更新结点
如果需要更新结点的文本,可以通过直接修改Element.text来实现。如果需要更新结点的属性,可以通过直接修改Element.attrib来实现。
对结点进行更新后,可以使用ElementTree.write()方法将更新后的 XML 文档写入文件中。
# 获取 XML 文档对象 ElementTree
tree = ET.parse('example.xml')
# 获取 XML 文档对象的根结点 Element
root = tree.getroot()
for rank in root.iter('rank'):
new_rank = int(rank.text) + 1
rank.text = str(new_rank)
rank.attrib['updated'] = 'yes'
tree.write('output.xml', encoding='UTF-8')
新生成的output.xml文件以下:
<?xml version='1.0' encoding='UTF-8'?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor direction="E" name="Austria" /> <neighbor direction="W" name="Switzerland" /> </country> <country name="Singapore"> <rank updated="yes">5</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor direction="N" name="Malaysia" /> </country> </data>
对比example.xml文件,可以看到output.xml文件已更新。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
参考资料
- https://docs.python.org/2/library/xml.html#xml-vulnerabilities
- https://stackoverflow.com/questions/1912434/how-do-i-parse-xml-in-python
# python
# elementtree
# 解析xml
# 创建xml
# Python3 xml.etree.ElementTree支持的XPath语法详解
# python xml.etree.ElementTree遍历xml所有节点实例详解
# Python中使用ElementTree解析XML示例
# python通过ElementTree操作XML获取结点读取属性美化XML
# python ElementTree 基本读操作示例
# python中lxml.etree 和 ElementTree 的区别
# 文档
# 递归
# 可以使用
# 来实现
# 可以通过
# 这篇文章
# 方法来
# 几个
# 是一种
# 还可以
# 说了
# 不多
# 朋友们
# 只会
# 树状
# 可以看到
# 几种
# 在对
# 便会
# 谢谢大家
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
php增删改查怎么学_零基础入门php数据库操作必知基础【教程】
惠州网站建设制作推广,惠州市华视达文化传媒有限公司怎么样?
php485函数参数是什么意思_php485各参数详细说明【介绍】
Laravel请求验证怎么写_Laravel Validator自定义表单验证规则教程
如何生成腾讯云建站专用兑换码?
laravel怎么为API路由添加签名中间件保护_laravel API路由签名中间件保护方法
Laravel怎么使用Markdown渲染文档_Laravel将Markdown内容转HTML页面展示【实战】
如何在云虚拟主机上快速搭建个人网站?
东莞市网站制作公司有哪些,东莞找工作用什么网站好?
高防服务器租用指南:配置选择与快速部署攻略
Laravel如何使用Service Provider注册服务_Laravel服务提供者配置与加载
PythonWeb开发入门教程_Flask快速构建Web应用
Laravel辅助函数有哪些_Laravel Helpers常用助手函数大全
Laravel用户密码怎么加密_Laravel Hash门面使用教程
Laravel怎么使用Collection集合方法_Laravel数组操作高级函数pluck与map【手册】
矢量图网站制作软件,用千图网的一张矢量图做公司app首页,该网站并未说明版权等问题,这样做算不算侵权?应该如何解决?
Laravel如何处理CORS跨域请求?(配置示例)
在线ppt制作网站有哪些软件,如何把网页的内容做成ppt?
如何正确下载安装西数主机建站助手?
如何确保西部建站助手FTP传输的安全性?
Laravel如何实现本地化和多语言支持?(i18n教程)
如何快速搭建自助建站会员专属系统?
,南京靠谱的征婚网站?
高端建站如何打造兼具美学与转化的品牌官网?
Win11怎么更改系统语言为中文_Windows11安装语言包并设为显示语言
Laravel如何保护应用免受CSRF攻击?(原理和示例)
在线制作视频网站免费,都有哪些好的动漫网站?
如何在阿里云域名上完成建站全流程?
JavaScript模板引擎Template.js使用详解
Laravel怎么实现API接口鉴权_Laravel Sanctum令牌生成与请求验证【教程】
Windows10电脑怎么查看硬盘通电时间_Win10使用工具检测磁盘健康
laravel怎么实现图片的压缩和裁剪_laravel图片压缩与裁剪方法
Laravel Eloquent:优雅地将关联模型字段扁平化到主模型中
Java Adapter 适配器模式(类适配器,对象适配器)优缺点对比
Laravel如何使用.env文件管理环境变量?(最佳实践)
个人摄影网站制作流程,摄影爱好者都去什么网站?
🚀拖拽式CMS建站能否实现高效与个性化并存?
JavaScript如何实现错误处理_try...catch如何捕获异常?
Win10如何卸载预装Edge扩展_Win10卸载Edge扩展教程【方法】
Win11怎么设置虚拟桌面 Win11新建多桌面切换操作【技巧】
Laravel怎么解决跨域问题_Laravel配置CORS跨域访问
简单实现Android验证码
如何在HTML表单中获取用户输入并结合JavaScript动态控制复利计算循环
Laravel如何发送邮件_Laravel Mailables构建与发送邮件的简明教程
使用Dockerfile构建java web环境
活动邀请函制作网站有哪些,活动邀请函文案?
C++用Dijkstra(迪杰斯特拉)算法求最短路径
Laravel数据库迁移怎么用_Laravel Migration管理数据库结构的正确姿势
Laravel如何实现数据库事务?(DB Facade示例)
如何使用 jQuery 正确渲染 Instagram 风格的标签列表

