我目前正在使用一个大型代码库,其中最近一个 API 的签名发生了更改。所以我需要修改数千个文件才能获得新功能。因此开发了一个java程序来获取所有
*.java
文件并寻找旧的API模式。如果发现,请更换新图案。
API(3,Utils.FIFTY,key1,key4)
API(key1,key4)
所以我创建了一个正则表达式模式来匹配旧的 API,如
API\([\d,\s\.\w]*(key[\.\w\s,]*)\)
如果匹配,它将替换为
replaceString = matcher.group(1) + "(" + matcher.group(2) + ")";
因此,使用当前代码而不是预期的
API(key1,key4)
,我得到了API(key4)
。我分析了这个问题,我的推断是 \w
捕获了第一个 key 模式。如果我们需要匹配,我们需要进行负向预测。
任何人都可以分享解决正则表达式问题的最佳一致方法吗?
F.J 的答案与此测试用例不匹配:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class APIUpdater {
public static void main( String[] args ) {
String source = "\n" +
"API( key.getValue( 18 ),call( key1 ).mth(),key1,key4);\n" +
"API(\n" +
"\t3,\n" +
"\tUtils.FIFTY,\n" +
"\tkey1,\n" +
"\tkey4 );\n" +
"API(3,Utils.FIFTY,key1,key4);\n";
Pattern p =
Pattern.compile( "API\\([.\\w\\s,]*?,\\s*(key[\\.\\w\\s,]*)\\)" );
Matcher m = p.matcher( source );
while( m.find())
{
System.err.println( m.replaceAll( "API(key1,key4)" ));
}
}
}
输出是:
API( key.getValue( 18 ),call( key1 ).mth(),key1,key4);
API(key1,key4);
API(key1,key4);
多行调用不匹配,但空格处理正确。
需要一个具有语法的真正解析器来解析 Java,正则表达式无法完成这项复杂的工作,因为它们在词法级别(单词,而不是句子)工作。
类似以下内容应该有效:
API\([\.\w \t,]*?,\s*(key[\.\w \t,]*)\)
这里的主要变化是将第一个字符类的重复从
*
更改为*?
,这意味着它现在将匹配尽可能少的字符,而不是尽可能多的字符,所以你们所有的key
参数将包含在您的匹配组中。
您可能想尝试Recoder,它允许您应用源代码转换。