如何使用 CUPS 将文本可搜索 PDF 转换为图像 PDF?

问题描述 投票:0回答:2

我正在努力寻找一种将文本可搜索 PDF 转换为图像 PDF 的方法。 通常,您可以在 Adobe Reader 上手动实现这一点,方法是选择“打印为图像”选项,将 PDF 打印到文件。这样,所选 PDF 的所有页面都将转换为图像。

我需要一个Linux命令行程序来快速获得相同的结果,因为我需要处理大量的PDF文件。

常用称呼:

lp -d PRINTER_NAME "$FILENAME"

无法将文本 PDF 转换为图像 PDF,而且我找不到任何可用选项来执行此操作。 你知道我能做什么吗?或者你建议我一个更好的工具? 谢谢

linux image pdf cups
2个回答
1
投票

我遇到了同样的问题,我寻找解决方案,但只找到了一个:一个名为 Okular 的软件(https://okular.kde.org/ - 此时,对于 Debian,版本 17.12.2)。

不幸的是,这不是命令行。

要将 PDF 文本转换为图像(或类似图像),您需要完成以下步骤:

  • 打开奥库拉,
  • 在 Okular 中打开 PDF 文档并
  • 选择菜单选项“文件|打印...”。

打印窗口将打开,然后您必须选择打印机“打印机到文件(PDF)”。然后单击“选项”窗口的按钮。现在,选择“PDF 选项”选项卡并选中“强制光栅化”选项。

要完成,请单击“打印”按钮。


0
投票

Ghostscript(Debian/Ubuntu apt 软件包:ghostscript,测试版本 10.01.1)提供 PDF 输出设备,默认情况下将输出分辨率为 720 DPI 的“光栅化* PDF(图像 PDF)”

gs -sDEVICE=pdfimage24 -o output.pdf input.pdf
输出分辨率可以使用 

-r...

 选项进行配置。例如,要创建低分辨率 150 DPI 光栅化图像 PDF:

gs -sDEVICE=pdfimage24 -r150 -o output-dpi-150.pdf input.pdf
请注意,低分辨率设置上的 

Ghostscript 将为基于矢量的字体创建像素化结果,因为它不使用内部放大/抗锯齿:例如黑色文本将输出为黑色或白色像素,中间没有灰色褪色。

为了利用抗锯齿功能提高低分辨率 PDF 的质量,请让

Ghostscript 以高 DPI 值渲染,然后使用 -dDownScaleFactor=...

 将其缩小到所需的分辨率:

gs -sDEVICE=pdfimage24 -r1200 -dDownScaleFactor=8 -o output-internal-1200-dpi-final-150-dpi.pdf input.pdf
    
© www.soinside.com 2019 - 2024. All rights reserved.