给出以下 xml:
<foo bar="&foobar">some text</foo>
我需要获取 bar 属性的值而不对其进行转义。到目前为止,我在 PowerShell 中尝试过的每种方法都会产生这个值:
&foobar
而不是这个:
&foobar
我需要后者,因为我需要字面的、正确转义的值来保留。
如果我这样做:
[xml]$xml = "<foo bar='&foobar'>some text</foo>"
$xml.foo.bar
属性值未转义(即 &foobar)。
如果我这样做:
$val = $xml | select-xml "/foo/@bar"
$val.Node.Value
属性值未转义(即 &foobar)。
确保使用 PowerShell 获取属性的原始转义值的最佳方法是什么?
[Security.SecurityElement]::Escape($xml.foo.bar)
使用上面的示例 XML,以下每项都将为 bar 属性生成原始的转义值:
使用 XPath:
$val = $xml | select-xml "/foo/@bar"
$val.Node.get_innerXml()
使用 PowerShell 的本机 XML 语法:
$xml.foo.attributes.item(0).get_innerXml()
您还可以使用
[System.Web.HttpUtility]::HtmlEncode($xml.foo.bar)
。
这里有一个关于使用 PowerShell 进行 html 编码的很好的答案:What is the best way to escape html特定字符在(PowerShell)中的字符串
我不确定它比 @shay 的答案更好,因为数据仍然通过 XML 解析器传递,解析器返回未转义的值,然后通过函数传回以再次转义它。
“内容”在任何情况下都被操纵过,它不是“原始内容”。这可能有点吹毛求疵,但在过去,当我需要对最初发送的内容进行不可否认时,我会将整个 blob 存储为文本。
通过访问 @bar 属性 OuterXml 属性来获取“文本”是可以接受的。 OuterXml 属性将返回:
bar="&foobar"
从那里,我们可以做类似的事情:
$xml.foo.attributes['bar'].OuterXml.Split("=")[1]
返回:
"&foobar"
我认为这就是我们想要结束的地方,但你可能可以用更好的方式做到这一点。 :)
那又如何
<foo bar="&amp;foobar">some text</foo>
其中
&
替换为 &
,则 "amp;foobar"
被解释为简单文本。