我能够从OCR结果中获取以下泰卢固语字符串。我需要为该字符串应用正则表达式。有谁能帮助我如何获取性别、姓名、地址等信息?
customStr = "డివిజన్: షాద్ నగర్\n(గ్రామం: వెలిజర్ల -1\n\n \n \n \n\n \n\n \n\n||\n\n(|\n\n|||\n\n|||\n\nఖాతానెం.: 783\n\n \n\n' 1. పట్టాదారు పేరు ఇంటిపేరుతో : చతుర్వేదుల భార్గవి\n., 2. తండ్రి / భర్తపేరు : శ్రీధర కేదార్ నాథ్\n\n౩. స్త్రీ / పురుషుడు : Female\n, 4. చిరునామా : వెలిజర్ల -1\n5. కులము : General\n6. ఆధార్ సంఖ్య : XXXXXXXX8381\n\n7. పట్టాదారు సంతకం ఎడమ /కుడి చేతి వేలిముద్ర\n\nతహశీల్దార్ సంత!\n\n \n\nith CamScanner"
我正在使用下面的源代码,但没有结果。
String[] lines = customStr.split("\\r?\\n", -1);
for(String line : lines) {
if (customStr.contains("స్త్రీ / పురుషుడు")){
text4.setText(line);
}
else{
System.out.printf("ok");
}
}
使用Regex与Pattern和Matcher来获取性别、姓名和地址.参考下面的例子。
Pattern genderPattern = Pattern.compile("౩. స్త్రీ / పురుషుడు : (.*?)\n,");
Pattern addressPattern = Pattern.compile("4. చిరునామా : (.*?)\n5.");
Pattern namePattern = Pattern.compile("1. పట్టాదారు పేరు ఇంటిపేరుతో : (.*?)\n.,");
Matcher m;
m=genderPattern.matcher(customStr);
if(m.find())
gender = m.group(1));
m=addressPattern.matcher(customStr);
if(m.find())
address = m.group(1));
m=namePattern.matcher(customStr);
if(m.find())
name = m.group(1));