码迷,mamicode.com
首页 > 编程语言 > 详细

Selenium2+Python3.6实战(七):读取xml文件,获得标签信息ExpatError: not well-formed (invalid token)

时间:2017-07-26 12:30:20      阅读:171      评论:0      收藏:0      [点我收藏+]

标签:dev   erro   trace   traceback   并且   nbsp   build   资料   selenium2   

在读取xml文件的标签信息时,运行后出现错误提示:

Traceback (most recent call last):
  File "D:/Python/html/read-xml.py", line 3, in
    dom = minidom.parse(‘info.xml‘)
  File "D:\Program Files\Python36\lib\xml\dom\minidom.py", line 1958, in parse
    return expatbuilder.parse(file)
  File "D:\Program Files\Python36\lib\xml\dom\expatbuilder.py", line 911, in parse
    result = builder.parseFile(fp)
  File "D:\Program Files\Python36\lib\xml\dom\expatbuilder.py", line 207, in parseFile
    parser.Parse(buffer, 0)
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 11, column 18

仔细查看了xml源代码和python源代码都没有发现有语法的问题,然后又在网上查了一些资料,终于找到了原因:“转码”问题。

如果xml文件中没有中文,自然能够输入所需要的数据,但是现在xml文件中有中文。一般情况我们在做自动化测试的时候,习惯用txt来编辑xml文件进行数据保存,但是在用txt编辑完xml文件后,都习惯性的直接点击保存,默认保存的编码方式是ANSI。问题就出在编码方式,如果我们用UTF-8的编码方式保存后,重新执行脚本,那么程序执行成功,正确输出中文。

找到原因后,我重新将txt文件另存为xml文件,并且在保存时将编码方式选择为UTF-8:

保存好以后再重新运行代码:

from xml.dom import minidom

dom = minidom.parse(‘info.xml‘)

root = dom.documentElement

print (root.nodeName) print (root.nodeValue) print (root.nodeType) print (root.ELEMENT_NODE)

 

运行结果显示为:

info

None

1

1

 

附上xml文件代码:

<?xml version="1.0" encoding="utf-8"?>
<info>
    <base>
      <platform>Windows</platform>
      <browser>Firefox</browser>
      <url>http://www.baidu.com</url>
        <login username="admin" password="123456"/>
        <login username="guest" password="654321"/>
    </base>
    <test>
        <province>北京</province>
        <province>广东</province>
          <city>深圳</city>
          <city>珠海</city>
        <province>浙江</province>
          <city>杭州</city>
    </test>
</info>

Selenium2+Python3.6实战(七):读取xml文件,获得标签信息ExpatError: not well-formed (invalid token)

标签:dev   erro   trace   traceback   并且   nbsp   build   资料   selenium2   

原文地址:http://www.cnblogs.com/CarolSpace/p/7238855.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!