我正在尝试使用 sed 清理 XML 文件。
我需要删除所有
<DistanceMeters>123.123</DistanceMeters>
。
我一直在尝试使用这个命令,但没有成功:
sed 's/(<DistanceMeters>)[.]*?(<\/DistanceMeters>)/ /g' file.txc
示例节点:
<Trackpoint><Time>2014-02-12T18:18:49+11:00</Time>
<Position><LatitudeDegrees>35.209656</LatitudeDegrees><LongitudeDegrees>28.99924</LongitudeDegrees></Position>
<AltitudeMeters>586.99994</AltitudeMeters>
<DistanceMeters>148.30713</DistanceMeters>
<Cadence>4</Cadence>
<Extensions><TPX xmlns="http://www.garmin.com/xmlschemas/ActivityExtension/v2" CadenceSensor="Bike"><Speed>0.043145742</Speed></TPX></Extensions></Trackpoint>
为了让事情变得更加混乱,源文件都在一行中。
谢谢。
如果
DistanceMeters
位于单独的一行中,只需执行:
awk '!/DistanceMeters/' file
<Trackpoint><Time>2014-02-12T18:18:49+11:00</Time>
<Position><LatitudeDegrees>35.209656</LatitudeDegrees><LongitudeDegrees>28.99924</LongitudeDegrees></Position>
<AltitudeMeters>586.99994</AltitudeMeters>
<Cadence>4</Cadence>
<Extensions><TPX xmlns="http://www.garmin.com/xmlschemas/ActivityExtension/v2" CadenceSensor="Bike"><Speed>0.043145742</Speed></TPX></Extensions></Trackpoint>
要将其从文本块内删除,您可以执行以下操作:
awk '{sub(/<DistanceMeters>[^>]*>/,x)}8' file
或与
sed
:
sed 's/<DistanceMeters>[^>]*>//g' file
这两者都不是贪婪的,因此它不会破坏多次出现
<DistanceMeters>
块的行,而不是使用贪婪 .*