无法使用python脚本将pdf转换为文本

Question

我想使用pdftotext命令将我所有的.pdf文件从特定目录转换为.txt格式...但是我想使用python脚本来做到这一点...我的脚本包含：

import glob 
import os

fullPath = os.path.abspath("/home/eth1/Downloads")

for fileName in glob.glob(os.path.join(fullPath,'*.pdf')):
   fullFileName = os.path.join(fullPath, fileName)
   os.popen('pdftotext fullFileName')

但是我收到以下错误：

Error: Couldn't open file 'fullFileName': No such file or directory.

Answer 1

您将fullFileName从字面上传递给os.popen。您应该改为执行以下操作（假设不必逃避fullFileName）：

Answer 2

1
投票

将最后一行更改为

Answer 3

如果您的pdf文件位于AWS S3（简单存储服务）中，请传递未签名的URL。

无法使用python脚本将pdf转换为文本

问题描述投票：0回答：3

3个回答

最新问题

无法使用python脚本将pdf转换为文本

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3