正则表达式问题 - 匹配 API 名称

问题描述 投票:0回答:3

我目前正在使用一个大型代码库,其中最近一个 API 的签名发生了更改。所以我需要修改数千个文件才能获得新功能。因此开发了一个java程序来获取所有

*.java
文件并寻找旧的API模式。如果发现,请更换新图案。

旧API

API(3,Utils.FIFTY,key1,key4)

新API

API(key1,key4)

所以我创建了一个正则表达式模式来匹配旧的 API,如

API\([\d,\s\.\w]*(key[\.\w\s,]*)\)
如果匹配,它将替换为

replaceString = matcher.group(1) + "(" + matcher.group(2) + ")";

因此,使用当前代码而不是预期的

API(key1,key4)
,我得到了
API(key4)
。我分析了这个问题,我的推断是
\w
捕获了第一个 key 模式。如果我们需要匹配,我们需要进行负向预测。

任何人都可以分享解决正则表达式问题的最佳一致方法吗?

java regex regex-lookarounds
3个回答
2
投票

F.J 的答案与此测试用例不匹配:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class APIUpdater {
   public static void main( String[] args ) {
      String source = "\n" +
        "API( key.getValue( 18 ),call( key1 ).mth(),key1,key4);\n" +
        "API(\n" +
        "\t3,\n" +
        "\tUtils.FIFTY,\n" +
        "\tkey1,\n" +
        "\tkey4 );\n" +
        "API(3,Utils.FIFTY,key1,key4);\n";
      Pattern p =
         Pattern.compile( "API\\([.\\w\\s,]*?,\\s*(key[\\.\\w\\s,]*)\\)" );
      Matcher m = p.matcher( source );
      while( m.find())
      {
         System.err.println( m.replaceAll( "API(key1,key4)" ));
      }
   }
}

输出是:

API( key.getValue( 18 ),call( key1 ).mth(),key1,key4);
API(key1,key4);
API(key1,key4);

多行调用不匹配,但空格处理正确。

需要一个具有语法的真正解析器来解析 Java,正则表达式无法完成这项复杂的工作,因为它们在词法级别(单词,而不是句子)工作。


1
投票

类似以下内容应该有效:

API\([\.\w \t,]*?,\s*(key[\.\w \t,]*)\)

这里的主要变化是将第一个字符类的重复从

*
更改为
*?
,这意味着它现在将匹配尽可能少的字符,而不是尽可能多的字符,所以你们所有的
key
参数将包含在您的匹配组中。


1
投票

您可能想尝试Recoder,它允许您应用源代码转换。

© www.soinside.com 2019 - 2024. All rights reserved.