我想使用pdftotext命令将我所有的.pdf文件从特定目录转换为.txt格式...但是我想使用python脚本来做到这一点...我的脚本包含:
import glob
import os
fullPath = os.path.abspath("/home/eth1/Downloads")
for fileName in glob.glob(os.path.join(fullPath,'*.pdf')):
fullFileName = os.path.join(fullPath, fileName)
os.popen('pdftotext fullFileName')
但是我收到以下错误:
Error: Couldn't open file 'fullFileName': No such file or directory.
您将fullFileName
从字面上传递给os.popen
。您应该改为执行以下操作(假设不必逃避fullFileName
):
将最后一行更改为
如果您的pdf文件位于AWS S3(简单存储服务)中,请传递未签名的URL。