我尝试将 pdf 文件转换为 word、excel 和 powerpoint。 我已经尝试了很多这样的命令:
soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf
/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'
总是从 soffice/libreoffice/unoconv 收到这个错误信息:
:1: parser error : Document is empty
%PDF-1.7
这个是 abiword
Unable to init server: Could not connect: Connection refused
** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused
除了 abiword 之外的所有命令。我得到了一个里面有坏字符的文档文件。 但是从来没有得到一个合适的文件。
我尝试创建一个文件转换器,所以我只需要命令行方法。不想使用某人的 API。
谢谢
设法用soffice做到了。 我必须安装这个包:libreoffice-pdfimport 并且不要忘记使用 --infilter="writer_pdf_import"
Linux 有一些应用程序可以将 pdf 作为图像导入:LibreOffice、Okular、Calibre。
但是如果你想要可编辑的文本,那么你需要安装pdf工具包
pdftk
,然后运行转换实用程序pdf2txt
。终端命令是:
pdf2txt input.pdf output.txt
之后,将txt文件导入wordpro,完成最后的编辑/排版。