我创建了一个java应用程序,用于使用正则表达式解析log4j日志文件,该应用程序对于我在下面显示的日志运行良好
1999-11-27 15:49:37,459 [thread-x] ERROR mypackage - Catastrophic system failure
但不为
工作2015-01-22 01:52:54,237 [http-bio-80-exec-5] FATAL TestLog4jServlet - Show FATAL message
我的 log4j ConversionPattern 如下所示
log4j.appender.Appender2.layout.ConversionPattern=%d [%t] %-7p %10c{1} - %m%n
任何人都可以告诉我一些解决方案吗
我的代码如下
public static void main(String[] args) {
String regex = "(\\d{4}-\\d{2}-\\d{2}) (\\d{2}:\\d{2}:\\d{2},\\d{3}) \\[(.*)\\] ([^ ]*) ([^ ]*) - (.*)$";
Pattern p = Pattern.compile(regex);
String[] samples = {
"2015-01-22 01:52:54,237 [http-bio-80-exec-5] FATAL TestLog4jServlet - Show FATAL message"
};
Matcher m = p.matcher(samples[1]);
System.out.println(m.matches());
if (m.matches() && m.groupCount() == 6) {
String date = m.group(1);
String time = m.group(2);
String threadId = m.group(3);
String priority = m.group(4);
String category = m.group(5);
String message = m.group(6);
System.out.println("date: " + date);
System.out.println("time: " + time);
System.out.println("threadId: " + threadId);
System.out.println("priority: " + priority);
System.out.println("category: " + category);
System.out.println("message: " + message);
}
}
因为
FATAL
和 TestLog4jServlet
之间有两个空格,但您在正则表达式中只包含一个空格。所以我建议您将相应的空格替换为<space>+
,这样可以允许一个或多个空格。
(\d{4}-\d{2}-\d{2}) (\d{2}:\d{2}:\d{2},\d{3}) \[(.*?)\] ([^ ]*) +([^ ]*) - (.*)$
^
|
Java 正则表达式是,
"(\\d{4}-\\d{2}-\\d{2}) (\\d{2}:\\d{2}:\\d{2},\\d{3}) \\[(.*)\\] ([^ ]*) +([^ ]*) - (.*)$"
我认为Logstash更适合解析日志。
将组名称添加到检测到的正则表达式模式中 用于解析 log4j 日志的正则表达式
(?<date>\d{4}-\d{2}-\d{2}) +(?<time>\d{2}:\d{2}:\d{2},\d{3}) +(\[thread-(?<threadId>.*?)\])(?<logLevel>\S*) (?<package>(.*?)) - (?<msg>.*)