如何通过编程方式使用AcroTextExtractor.exe?

问题描述 投票:6回答:1

我正在尝试从PDF文件中提取批量文本。尝试过许多库和Adobe Reader对我来说似乎是最准确的文本提取器。

我注意到安装了Adobe Reader的文件夹中的文件AcroTextExtractor.exe。 sname看起来很有希望,谷歌搜索它们显示这个文件是PDF到文本转换例程的一部分。

如何从命令行调用此文件来进行文本提取?

adobe-reader
1个回答
1
投票

我也想在同一场景中使用它。

我做了一个实验,看看我是否可以检查在AcroTextExtractor.exe发布时可能会看到的命令行。

我拿了一张大PDF并在Adobe Acrobat Reader DC版本2018.009.20050中打开它。然后我将其保存为文本(文件|另存为其他文本),当Reader生成文本文件(成功)时,我检查了任务管理器,sysinternals Process Explorer和Powershell中的WMI中的所有正在运行的进程。

不幸的是,我找不到一个包含AcroTextExtractor.exe的路径启动的进程;因此我无法抓住命令行。

它可能是一个红鲱鱼。

© www.soinside.com 2019 - 2024. All rights reserved.