Ghostscript 不读取 pdf 文件

问题描述 投票:0回答:0

我的输入文件夹中有超过 10 个 pdf。我试图让 Ghostscript 读取输入文件夹中的 10 个 pdf,然后将它们传输到输出 pdf 文件夹。但是,它只能读取 3 个 pdf 文件。这里的解决方案是什么?谢谢。

Ghostscript 只读取 3 个 pdf,其余 7 个 pdf 不被 Ghostscript 读取。它不会转移到输出文件夹。

这是我遇到的问题:

**** 无法打开初始设备,正在退出。 huggingface/tokenizers:在使用并行性之后,当前进程刚刚分叉。禁用并行性以避免死锁... 要禁用此警告,您可以: - 尽可能避免在分叉前使用

tokenizers
- 显式设置环境变量 TOKENIZERS_PARALLELISM=(true | false) GPL Ghostscript 9.56.1 (2022-04-04) 版权所有 (C) 2022 Artifex Software, Inc。保留所有权利。 本软件根据 GNU AGPLv3 提供,不提供任何保证: 有关详细信息,请参阅文件 COPYING。 GPL Ghostscript 9.56.1:无法打开 X 显示“(空)”。 **** 无法打开初始设备,退出。

这是我正在运行的代码:

"import os

pdf_folder_path = './pdf' # Replace with the path to your PDF files directory
output_folder_path = './output' # Replace with the path to your output directory

if not os.path.exists(output_folder_path):
   os.makedirs(output_folder_path)

for file_name in os.listdir(pdf_folder_path):
    if file_name.endswith('.pdf'):
      input_path = os.path.join(pdf_folder_path, file_name)
      output_path = os.path.join(output_folder_path, file_name[:-4] + '_output.pdf')
        !gs -o $output_path -sDEVICE=pdfwrite $input_path

loaders = [UnstructuredPDFLoader(os.path.join(output_folder_path, fn)) for fn in
os.listdir(output_folder_path)]
 loaders

我期待有 10 个 pdf 文件被 Ghostscript 读取并传输到输出文件夹中。

ghostscript langchain
© www.soinside.com 2019 - 2024. All rights reserved.