用python更改xml文件中的子字符串

问题描述 投票:0回答:1

我正在尝试更改xml文件中的符号<>

    <divclass="specific_info_group">
    <divclass="specific_info_title">model</div>
    <divclass="specific_info_txt">

我试图用re代替它:

        re.sub('&lt;','<',desc)
        re.sub('&gt;','>', desc)

代码没有任何改变,我仍然得到那些符号。另外,我试图与此一起工作:

        desc.replace('&lt;','<')
        desc.replace('&gt;', '<')

但仍然无法在输出XML文件中获取html格式

任何解决方案?

python-3.x replace innerhtml str-replace
1个回答
0
投票

因为它是转义的html,所以应该使用html解析器进行转义。

desc = """
    &lt;divclass="specific_info_group"&gt;
    &lt;divclass="specific_info_title"&gt;model&lt;/div&gt;
    &lt;divclass="specific_info_txt"&gt;
    """

import html.parser
parser = html.parser.HTMLParser()
bla = parser.unescape(desc)

print(bla)
#    <divclass="specific_info_group">
#    <divclass="specific_info_title">model</div>
#    <divclass="specific_info_txt">
© www.soinside.com 2019 - 2024. All rights reserved.