这是我的问题:我有一个自定义对象列表,其中包含一个名为label的String。这个列表很大但是太大了,大约1000个对象。我想用label
进行字母排序。
问题是,一些label
包含像É
,(
,e
或E
这样的角色作为第一个角色。所以我不得不使用deAccent()
函数找到here来独立于重音或其他类似的东西来排序它。使用此函数,列表['Gab','eaaa','Éaa']
被排序为['eaaa','Éaa','Gab']
而不是['eaaa','Gab','Éaa']
。因为当我们使用compareTo
方法时,É
是在G
之后。这是我有的:
private List<Formula> sortFormulaList(List<Formula> formulaList) {
// Sort all label alphabetically
if (formulaList.size() > 0) {
Collections.sort(formulaList, (formula1, formula2) ->
deAccent(formula1.getLabel()).toLowerCase().compareTo(deAccent(formula2.getLabel().toLowerCase())));
}
return formulaList;
}
private String deAccent(String str) {
String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD);
Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
return pattern.matcher(nfdNormalizedString).replaceAll("");
}
如果我不使用deAccent()
它足够快我的目的但是当我使用它需要1到3秒的时间来排序。
我怎么能做出这样的想法呢?或者让这个更快
考虑@ Henry的优秀建议,Formula
可能如下所示:
public class Formula {
private final String label;
private final String deAccentedLabel;
public Formula(String label) {
this.label = label;
this.deAccentedLabel = deAccent(label);
}
public String getLabel() {
return label;
}
public String getDeAccentedLabel() {
return comparableLabel;
}
private String deAccent(String str) {
String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD);
Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
return pattern.matcher(nfdNormalizedString).replaceAll("");
}
}
然后它可以像这样使用:
Collections.sort(formulaList, (formula1, formula2) -> formula1.getDeAccentedLabel().toLowerCase().compareTo(formula2.getDeAccentedLabel().toLowerCase());
然而,这通过添加deAccentedLabel
方法暴露public getDeAccentedLabel()
。
我在评论中建议的是隐藏deAccentedLabel
以保持Formula
的公共界面尽可能干净。所以要排序,Formula
提供比较器而不是其他必须构建它的类。 Formula
看起来像这样:
public class Formula {
private final String label;
private final String comparableLabel;
public Formula(String label) {
this.label = label;
this.comparableLabel = deAccent(label).toLowerCase();
}
public String getLabel() {
return label;
}
private String deAccent(String str) {
String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD);
Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
return pattern.matcher(nfdNormalizedString).replaceAll("");
}
public static Comparator<Formula> getLabelComparator() {
return (formula1, formula2) -> formula1.comparableLabel.compareTo(formula2.comparableLabel);
}
}
并像这样使用:
Collections.sort(formulaList, Formula.getLabelComparator());