使用sed从XML文件中删除节点和数据

问题描述 投票:0回答:1

我正在尝试使用 sed 清理 XML 文件。

我需要删除所有

<DistanceMeters>123.123</DistanceMeters>

我一直在尝试使用这个命令,但没有成功:

sed 's/(<DistanceMeters>)[.]*?(<\/DistanceMeters>)/ /g' file.txc

示例节点:

<Trackpoint><Time>2014-02-12T18:18:49+11:00</Time>
<Position><LatitudeDegrees>35.209656</LatitudeDegrees><LongitudeDegrees>28.99924</LongitudeDegrees></Position>
<AltitudeMeters>586.99994</AltitudeMeters>
<DistanceMeters>148.30713</DistanceMeters>
<Cadence>4</Cadence>
<Extensions><TPX xmlns="http://www.garmin.com/xmlschemas/ActivityExtension/v2" CadenceSensor="Bike"><Speed>0.043145742</Speed></TPX></Extensions></Trackpoint>

为了让事情变得更加混乱,源文件都在一行中。

谢谢。

xml regex sed
1个回答
3
投票

如果

DistanceMeters
位于单独的一行中,只需执行:

awk '!/DistanceMeters/' file
<Trackpoint><Time>2014-02-12T18:18:49+11:00</Time>
<Position><LatitudeDegrees>35.209656</LatitudeDegrees><LongitudeDegrees>28.99924</LongitudeDegrees></Position>
<AltitudeMeters>586.99994</AltitudeMeters>
<Cadence>4</Cadence>
<Extensions><TPX xmlns="http://www.garmin.com/xmlschemas/ActivityExtension/v2" CadenceSensor="Bike"><Speed>0.043145742</Speed></TPX></Extensions></Trackpoint>

要将其从文本块内删除,您可以执行以下操作:

awk '{sub(/<DistanceMeters>[^>]*>/,x)}8' file

或与

sed
:

sed 's/<DistanceMeters>[^>]*>//g' file

这两者都不是贪婪的,因此它不会破坏多次出现

<DistanceMeters>
块的行,而不是使用贪婪
.*

© www.soinside.com 2019 - 2024. All rights reserved.