我开发Android应用程序。该应用程序允许用户突出显示PDF文件中的单词。然后,这些话必须被提取,所以我怎么能解析PDF文件,以获得从文件中提取的话没有任何图书馆吗?谁能帮我?
你必须自己编写代码,如果你不想使用图书馆。没有在Android SDK中的任何内建类PDF操作。
然而,你必须使用一个图书馆看看这个问题:
您可以在Android上使用iText库像我通过分析从资产PDF文件,并在Android ListView中显示它做它在我的项目很容易解析PDF容易。
iTextG链接:https://developers.itextpdf.com/itextg-android
assetManager = getAssets();
try{
InputStream inputStream = assetManager.open("sample.pdf");
String parsedText = "";
PdfReader reader = new PdfReader(inputStream);
int n = reader.getNumberOfPages();
for (int i = 0; i < n; i++)
parsedText = parsedText + PdfTextExtractor.getTextFromPage(reader, i + 1).trim() + "\n";
String[] data = parsedText.split("\n");
for(String d : data){
patients.add(d);
}
reader.close();
}catch (FileNotFoundException e){
Toast.makeText(this, "File Not Found", Toast.LENGTH_SHORT).show();
}catch (IOException e){
Toast.makeText(this, "IO Error reading input stream", Toast.LENGTH_SHORT).show();
}