我正在尝试使用 apache 库打开 .doc 文件 (97-2003),但是出现错误“该文档实际上是一个 XML 文件”。
private String getStringFromDoc(@NonNull File docFile) {
String stringDoc = "";
try (InputStream fileInputStream = new FileInputStream(docFile)) {
WordExtractor extractor = new WordExtractor(fileInputStream);
stringDoc = extractor.getText();
AkitaScenario.getInstance().getScenario().write(stringDoc);
log.info("DOC document parsed");
} catch (Exception e) {
log.error(e);
}
return stringDoc;
}
有办法处理吗?
我也遇到同样的问题,请问你找到方法了吗?