如何在 Linux 上将 PDF 转换为 DOCX

问题描述 投票:0回答:2

我尝试将 pdf 文件转换为 word、excel 和 powerpoint。 我已经尝试了很多这样的命令:

soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf

/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf

abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'

总是从 soffice/libreoffice/unoconv 收到这个错误信息:

:1: parser error : Document is empty
%PDF-1.7

这个是 abiword

Unable to init server: Could not connect: Connection refused

** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused

除了 abiword 之外的所有命令。我得到了一个里面有坏字符的文档文件。 但是从来没有得到一个合适的文件。

我尝试创建一个文件转换器,所以我只需要命令行方法。不想使用某人的 API。

谢谢

linux ubuntu type-conversion libreoffice soffice
2个回答
13
投票

设法用soffice做到了。 我必须安装这个包:libreoffice-pdfimport 并且不要忘记使用 --infilter="writer_pdf_import"


0
投票

Linux 有一些应用程序可以将 pdf 作为图像导入:LibreOffice、Okular、Calibre。

但是如果你想要可编辑的文本,那么你需要安装pdf工具包

pdftk
,然后运行转换实用程序
pdf2txt
。终端命令是:

pdf2txt input.pdf output.txt

之后,将txt文件导入wordpro,完成最后的编辑/排版。

© www.soinside.com 2019 - 2024. All rights reserved.