我正在使用PCRE在以下正则表达式的帮助下匹配异常日志。
正则表达式
\[([\d -:]+)\]ERROR.*?(F:[^ ]+|F:).*?(?sx).*?(\b[a-zA-Z]*Exception\b)
例外日志样本
其中log语句捕获的exception inline(一行)
[2020-03-07 01:02:37.512]ERROR [L:xx F:yy T:zz R: C: ] xxxxxxx xxxxx xxxx xxxx NullPointerException
at com.package.name(b.java:20)
at com.package.name.someClass.someMethod(P.java:2423)
at com.package.name.someClass.someMethod(P.java:40)
at com.package.name.someClass.someMethod(P.java:4054)
其中捕获的下一个其他日志语句中的例外情况
[2020-03-07 01:02:37.512]ERROR [L:xx F:yy T:zz R: C: ] xxxxxxx xxxxx xxxx xxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxx xxxxxxxxxxx xxxxxxxx xxxx xxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxx xxxx NullPointerException
at com.package.name(b.java:20)
at com.package.name.someClass.someMethod(P.java:2423)
at com.package.name.someClass.someMethod(P.java:40)
at com.package.name.someClass.someMethod(P.java:4054)
第二个示例与所提到的正则表达式不匹配。
我也尝试过使用multi-line flag (\m),但由于它不匹配任何东西,它不会停止
示例
[2020-03-07 01:02:37.512]ERROR [L:xx F:yy1 T:zz1 R: C: ] xxxxxxx xxxxx xxxx xxxx
[2020-03-07 01:03:37.512]ERROR [L:xx F:yy2 T:zz2 R: C: ] xxxxxxx xxxxx xxxx xxxx
[2020-03-07 01:04:37.512]ERROR [L:xx F:yy3 T:zz3 R: C: ] xxxxxxx xxxxx xxxx xxxx
[2020-03-07 01:05:37.512]ERROR [L:xx F:yy4 T:zz5 R: C: ] NullPointerException
at com.package.name(b.java:20)
at com.package.name.someClass.someMethod(P.java:2423)
at com.package.name.someClass.someMethod(P.java:40)
at com.package.name.someClass.someMethod(P.java:4054)
预期结果
Group 1:2020-03-07 01:05:37.512,第2组:F:yy4,组3:NullPointerException
实际结果
第1组:2020-03-07 01:02:37.512第2组:F:yy1组3:NullPointerException
看到匹配第一行后如何直到找到完整的表达式才停止。
有人可以在这里帮我吗。
[您可以从模式的开始处检查下一行不是以[
开头,而在以后使用内联修饰符(?!.*\R\[\d)
时,它们使用负前瞻(?sx)
来表示数字。
此部分(F:[^ ]+|F:)
可以缩写为匹配F :,并且是非空格字符(F:\S*)
的0+倍
在字符类[\d -:]
中,连字符与范围匹配,而不仅是连字符。如果要按字面意义进行匹配,则可以例如将其移至末尾并添加匹配点。
^(?!.*\R\[\d)\[([\d :.-]+)\]ERROR.*?(F:\S*)(?sx).*?(\b[a-zA-Z]*Exception\b)