我有一段 Java 文本,我想使用模式和匹配器从中提取一些内容。这是我的程序:
public String getItemsByType(String text, String start, String end) {
String patternHolder;
StringBuffer itemLines = new StringBuffer();
patternHolder = start + ".*" + end;
Pattern pattern = Pattern.compile(patternHolder);
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
itemLines.append(text.substring(matcher.start(), matcher.end())
+ "\n");
}
return itemLines.toString();
}
当搜索的文本位于同一行时,此代码完全有效,例如:
String text = "My name is John and I am 18 years Old";
getItemsByType(text, "My", "John");
立即从文本中抓取文本“我的名字是约翰”。然而,当我的文字看起来像这样时:
String text = "My name\nis John\nand I'm\n18 years\nold";
getItemsByType(text, "My", "John");
它不会抓取任何东西,因为“My”和“John”位于不同的行上。我该如何解决这个问题?
用这个代替:
Pattern.compile(patternHolder, Pattern.DOTALL);
在 javadoc 中,
DOTALL
标志的含义是:
启用 dotall 模式。
在 dotall 模式下,表达式 .匹配任何字符,包括行终止符。默认情况下,此表达式不匹配行终止符。
使用
Pattern.compile(patternHolder, Pattern.DOTALL)
编译模式。这样,点将与换行符匹配。默认情况下,换行符以特殊方式处理,不与点匹配。