此代码获取pdf文件并将其转换为图像:
import os
import sys
from pdf2image import convert_from_path, convert_from_bytes
from pdf2image.exceptions import (
PDFInfoNotInstalledError,
PDFPageCountError,
PDFSyntaxError
)
# get all pdf files from directory
pdf_files = [filename for filename in os.listdir('.') if filename.endswith('.pdf')]
for pdf_file in pdf_files:
print(pdf_file)
images = convert_from_path(pdf_file)
for i, image in enumerate(images):
fname = pdf_file+'_image'+str(i)+'.jpg'
image.save(fname, "JPEG")
因此,我想从终端运行此代码,我需要使用argv从终端手动指定包含pdf文件的文件夹。
请帮助。
import sys
folder = sys.argv[1] # argv[0] is the script name
然后您就可以通过cli传递args了:python script.py ARG1 ARG2