使用 pdf2dox 进行浮点数除以零

问题描述 投票:0回答:1

我正在使用 pdf2docx 包将多个 pdf 文件转换为 docx 文件。这是代码:

def convert_pdf2docx(input_file: str, output_file: str, pages: Tuple = None):
    """Converts pdf to docx"""
    if pages:
        pages = [int(i) for i in list(pages) if i.isnumeric()]

    parse(input_file, output_file, pages=pages)

    summary = {
        "File": input_file, "Pages": str(pages), "Output File": output_file
    }
    # Printing Summary
    print("## Summary ########################################################")
    print("\n".join("{}:{}".format(i, j) for i, j in summary.items()))
    print("###################################################################")

我成功转换了大部分 pdf 文件,但在转换过程中某些文件出现错误:[错误]浮点数除以零

有没有办法在转换过程中忽略这样的错误?有没有办法知道 pdf 文件中的哪一页包含错误,以便我可以在转换文件之前对其进行过滤?

python pdf docx file-conversion
1个回答
0
投票

您可以像这样使用 try 和 catch 进行异常处理

   try:
    parse(input_file, output_file, pages=pages)
except SomeSpecificException as e:
    print("An error occurred:", e)
© www.soinside.com 2019 - 2024. All rights reserved.