我在我的 Android 应用程序中使用 FTS4 来实现全文搜索。应用程序中的数据来自 API,带有变音符号和重音符号。我在数据库中创建了 2 列,一列存储原始数据,另一列存储没有变音符号或重音符号的数据(使用规范化器删除)。当我搜索没有变音符号或重音符号的单词时,搜索会成功执行。当我想突出显示文本中找到的搜索查询时,问题就出现了。
所以对于例如。这句话是我从SO得到的:
詹姆斯问道:“这是蕾妮和诺埃尔的曾祖父母 1970 年代风格的避暑别墅,不是吗?”没有得到回应,他摇摇头——走开了。
如果我搜索 Renee,它会突出显示 Renée,但是当我执行搜索 Renee 时,它会成功找到包含单词 Renée's 的文本,但由于撇号,它不会突出显示它。
Search Term: Renee
Highlighted Output: Renée
Search Term: Renees
Highlighted Output: <whitespace>Renée’ <-- doesn't show the expected output
Expected Output: Renée’s
如果我使用
replaceAll
删除所有撇号以突出显示搜索的查询,它将显示突出显示的单词 Renée's 但仅直到撇号像这样 -> Renée' 甚至突出显示单词之前的空格。但如果段落中有更多撇号被删除,它会将突出显示的单词向后推得更远。
基本上我想在向用户显示的段落中显示Renée's,并突出显示整个单词,即使用户搜索 Renees。
这是我突出显示搜索文本的代码:
if (searchQuery != null){
String paragraph = data.getParagraph();
SpannableStringBuilder sb = new SpannableStringBuilder(paragraph);
String normalizedText = Normalizer.normalize(paragraph, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "").toLowerCase();
//String normalizedText = Normalizer.normalize(paragraph, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "").replaceAll("'", "").toLowerCase(); //remove all apostrophes -- this works but pushes back the highlighted text color because it doesn't count all stripped apostrophes in the original paragraph.
Pattern word = Pattern.compile(searchQuery, Pattern.CASE_INSENSITIVE);
Matcher match = word.matcher(normalizedText);
while (match.find()) {
BackgroundColorSpan fcs = new BackgroundColorSpan(Color.YELLOW);
sb.setSpan(fcs, match.start(), match.end(), Spannable.SPAN_EXCLUSIVE_EXCLUSIVE);
}
text.setText(sb);
}
即使使用撇号,如何突出显示搜索到的单词?
您可以在
['’]?
中的每个字符之间添加 '
模式(与可选的 ’
或 searchQuery
字符匹配):
Pattern word = Pattern.compile(TextUtils.join("['’]?", searchQuery.split("")), Pattern.CASE_INSENSITIVE);
这样,即使搜索短语内部有一个撇号,您也可以确保搜索短语匹配。
查看 正则表达式演示。