如何使用xmlstarlet打印XPath匹配的位置?

问题描述 投票:1回答:3

我想在pom.xml文件中找到对SNAPSHOT版本的引用。让我们使用位于here的POM文件作为示例。我想出了以下命令来查找包含字符串SNAPSHOT的元素:

$ xmlstarlet sel -t -m "//*[contains(text(), 'SNAPSHOT')]" -v . -n pom.xml
0.2-SNAPSHOT
4.12-SNAPSHOT
1.9.13-SNAPSHOT
20.0-SNAPSHOT

然而,正如上面所看到的,这只能给我自己的比赛文本。我想看到的是关于匹配位置的更多上下文,例如通向匹配元素的路径,如下所示:

$ xmlstarlet magical arguments
/project/version: 0.2-SNAPSHOT
/project/dependencies/dependency: 4.12-SNAPSHOT
/project/properties/jackson.version: 1.9.13-SNAPSHOT
/project/properties/guava.version: 20.0-SNAPSHOT

或者,将XML的精简版本作为输出也适用于我,例如:

$ xmlstarlet magical arguments
<project>
  <version>0.2-SNAPSHOT</version>
  <dependencies>
    <dependency>
      <version>4.12-SNAPSHOT</version>
    </dependency>
  </dependencies>
  <properties>
    <jackson.version>1.9.13-SNAPSHOT</jackson.version>
    <guava.version>20.0-SNAPSHOT</guava.version>
  </properties>
</project>

是否可以打印这些或其他类型的匹配发生位置的指示?

xmlstarlet
3个回答
2
投票

xmlstarlet可以使用打破嵌套的-b选项生成请求的输出:

xmlstarlet sel -t \
    -m "//*[contains(text(),'SNAPSHOT')]" \
    -m 'ancestor::*' -v 'name()' -o '/' \
    -b -v "concat(name(),': ',.)" -n pom.xml

输出:

project/version: 0.2-SNAPSHOT
project/dependencies/dependency/version: 4.12-SNAPSHOT
project/properties/jackson.version: 1.9.13-SNAPSHOT
project/properties/guava.version: 20.0-SNAPSHOT

1
投票

我无法使用选择工具生成所需的结果。但我设法修改生成的XSL以满足您的需要。

我使用-C开关生成了XSL:

xmlstarlet sel -C -t -m "//*[contains(text(), 'SNAPSHOT')]" -m 'ancestor-or-self::*' -v 'name()' -o / -n

输出:

<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:exslt="http://exslt.org/common" version="1.0" extension-element-prefixes="exslt">
  <xsl:output omit-xml-declaration="yes" indent="no"/>
  <xsl:template match="/">
    <xsl:for-each select="//*[contains(text(), 'SNAPSHOT')]">
      <xsl:for-each select="ancestor-or-self::*">
        <xsl:call-template name="value-of-template">
          <xsl:with-param name="select" select="name()"/>
        </xsl:call-template>
        <xsl:text>/</xsl:text>
        <xsl:value-of select="'&#10;'"/>
      </xsl:for-each>
    </xsl:for-each>
  </xsl:template>
  <xsl:template name="value-of-template">
    <xsl:param name="select"/>
    <xsl:value-of select="$select"/>
    <xsl:for-each select="exslt:node-set($select)[position()&gt;1]">
      <xsl:value-of select="'&#10;'"/>
      <xsl:value-of select="."/>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

然后我应用了以下补丁:

11d10
<         <xsl:value-of select="'&#10;'"/>
12a12,13
>       <xsl:value-of select="text()"/>
>       <xsl:value-of select="'&#10;'"/>

导致:

<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:exslt="http://exslt.org/common" version="1.0" extension-element-prefixes="exslt">
  <xsl:output omit-xml-declaration="yes" indent="no"/>
  <xsl:template match="/">
    <xsl:for-each select="//*[contains(text(), 'SNAPSHOT')]">
      <xsl:for-each select="ancestor-or-self::*">
        <xsl:call-template name="value-of-template">
          <xsl:with-param name="select" select="name()"/>
        </xsl:call-template>
        <xsl:text>/</xsl:text>
      </xsl:for-each>
      <xsl:value-of select="text()"/>
      <xsl:value-of select="'&#10;'"/>
    </xsl:for-each>
  </xsl:template>
  <xsl:template name="value-of-template">
    <xsl:param name="select"/>
    <xsl:value-of select="$select"/>
    <xsl:for-each select="exslt:node-set($select)[position()&gt;1]">
      <xsl:value-of select="'&#10;'"/>
      <xsl:value-of select="."/>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

如果将此转换应用于原始xml文件,则会获得所需的结果:

xmlstarlet tr modified.xsl input.xml

输出:

project/version/0.2-SNAPSHOT 
project/dependencies/dependency/version/4.12-SNAPSHOT
project/properties/jackson.version/1.9.13-SNAPSHOT
project/properties/guava.version/20.0-SNAPSHOT

0
投票

我想出了以下内容来生成XML的精简版本:

xmlstarlet ed -d "//*[count((.|.//*)[contains(text(), 'SNAPSHOT')]) = 0]" pom.xml

输出:

<?xml version="1.0"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
  <version>0.2-SNAPSHOT</version>
  <dependencies>
    <dependency>
      <version>4.12-SNAPSHOT</version>
    </dependency>
  </dependencies>
  <properties>
    <jackson.version>1.9.13-SNAPSHOT</jackson.version>
    <guava.version>20.0-SNAPSHOT</guava.version>
  </properties>
</project>

这个想法是删除每个不包含文本SNAPSHOT的节点,也没有包含它的任何后代。我真的不喜欢我必须使用(.|.//*)来匹配当前节点或其后代,必须有更好的方法,但我发现一个普通的.//*与当前节点不匹配,只有它的后代。

© www.soinside.com 2019 - 2024. All rights reserved.