我尝试使用WORDTABLE匹配一个单词。但是某些文本不匹配。
在以下输入中,阿富汗一词不匹配。如果我从WORDTABLE中删除ACoruña; n.a。,则它是匹配的。
样本输入:
Afghanistan
Report
report
示例CSV(test.csv):
Afghanistan;Afghan.
report;rep.
A Coruña;n.a.
代码:
PACKAGE uima.ruta.example;
RETAINTYPE(SPACE);
WORDTABLE Table = 'test.csv';
DECLARE Annotation Abbr(STRING short);
Document{->MARKTABLE(Abbr, 1, Table,true,0,"",0, "short" = 2)};
RETAINTYPE;
这很可能是由单词表中的空格引起的。有几个选项可以避免此问题,例如,激活配置参数dictRemoveWS。