这篇文章主要介绍了Python中怎么对XML文件的编码进行转换的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python中怎么对XML文件的编码进行转换文章都会有所收获,下面我们一起来看看吧。1.Python 使用的xml.etree.ElementTree
库只支持解析和生成标准的UTF-8格式的编码2.常见GBK
或GB2312
等中文编码的 XML 文件,用以在老旧系统中保证 XML 对中文字符的记录能力3.XML 文件开头有标识头,标识头指定了程序处理 XML 时应该使用的编码4.要修改编码,不仅要修改文件整体的编码,还要将标识头中 encoding 部分的值修改1.读取&解免费云主机域名码:使用二进制模式读取 XML 文件,将文件变为二进制流将二进制流使用.encode()
方法,使用原文件的编码格式进行解析为字符串2.处理标识头:使用.replace()
方法,替换字符串中的encoding="xxx"
部分3.编码&保存:将字符串使用新的编码格式进行保存GB2312 UTF:无问题,可直接按照上面的逻辑处理GBK UTF8GBK –> UTF8:无问题,可直接按照上面的逻辑处理UTF8 –> GBK:.encode()会报错,要加上error=”ignore”参数,忽略无法转换的字符这里的原理是:GBK 编码兼容 UTF-8 编码,因此无法转换的内容使用 GBK 直接也能显示GBK GB2312:无问题注意事项:由于这里需要直接替换标识头,要求编码名称一定得完全匹配,否则替换会失败如:GBK 不能写成 gbk,utf-8 不能写成 UTF8此代码仅在以上 GBK、GB2312、UTF-8 & 常用中英文基础上测试,其他的编码格式不保证一定能转换成功关于“Python中怎么对XML文件的编码进行转换”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“Python中怎么对XML文件的编码进行转换”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注百云主机行业资讯频道。
相关推荐: Java中String类、StringBuffer和StringBuilder怎么使用
这篇文章主要介绍“Java中String类、StringBuffer和StringBuilder怎么使用”,在日常操作中,相信很多人在Java中String类、StringBuffer和StringBuilder怎么使用问题上存在疑惑,小编查阅了各式资料,整理…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。