regex – 如何使用sed或Perl从xml文件中删除无效字符
发布时间:2020-12-15 14:22:33 所属栏目:Linux 来源:互联网
导读:我想摆脱所有无效的角色;使用sed的 XML文件中的示例十六进制值0x1A. 什么是正则表达式和命令行? 编辑 添加了Perl标签,希望获得更多响应.我更喜欢单线解决方案. 编辑 这些是有效的XML字符 x9 | xA | xD | [x20-xD7FF] | [xE000-xFFFD] | [x10000-x10FFFF] 假
我想摆脱所有无效的角色;使用sed的
XML文件中的示例十六进制值0x1A.
x9 | xA | xD | [x20-xD7FF] | [xE000-xFFFD] | [x10000-x10FFFF] 解决方法假设UTF-8 XML文档:perl -CSDA -pe' s/[^x9xAxDx20-x{D7FF}x{E000}-x{FFFD}x{10000}-x{10FFFF}]+//g; ' file.xml > file_fixed.xml 如果你想编码坏字节, perl -CSDA -pe' s/([^x9xAxDx20-x{D7FF}x{E000}-x{FFFD}x{10000}-x{10FFFF}])/ "&#".ord($1).";" /xeg; ' file.xml > file_fixed.xml 您可以通过几种不同的方式调用它: perl -CSDA -pe'...' file.xml > file_fixed.xml perl -CSDA -i~ -pe'...' file.xml # Inplace with backup perl -CSDA -i -pe'...' file.xml # Inplace without backup (编辑:台州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- linux – 无法从外部机器访问公开暴露的Docker容器端口,只能
- linux – 澄清需要关于Twelve-Factor App宣言和守护进程的第
- 使用sed删除bash中的空格
- sed – 我应该使用cut或awk来提取字段和字段子字符串吗?
- linux – 来自CoreOS的Docker和Rocket有什么区别?
- 当curl尝试解析主机时,如何更改php curl超时(curl err_no 6
- 如何在Linux中的终端中循环执行命令?
- OpenCV在与anaconda的Linux上使用python无法正常工作.获取未
- LINUX教程:PHP查询附近的人及其距离的实现方法
- initrd并启动Linux内核