我是 python 新手,在尝试执行以下代码时遇到此错误,该代码旨在获取此 pdf 的内容并将其放入 Excel 文档中。我的操作系统是 Windows 10,我通过 Anaconda3 使用 VS code。我不确定我做错了什么。提前谢谢大家。
FileNotFoundError: [WinError 2] The system cannot find the file specified
import tabula
file_path = (r"C:\Users\shattv\anaconda3\envs\venv1\TestInvoice.pdf")
oup = (r"C:\Users\shattv\anaconda3\envs\venv1\test.xlsx")
df = tabula.read_pdf(file_path,pages="all")
df.to_excel (oup)
我尝试检查 os.getcwd 并得到相同的文件路径:C:\Users\shattv naconda3 nvs env1>。以下是 Excel 和 pdf 文件的屏幕截图。我也尝试更改为反斜杠,但仍然出现此错误。
C:/Users/shattv/anaconda3/envs/venv1/TestInvoice.pdf"
试试这个:
删除文件前面的
r
标签。
file_path = ("C:/Users/user/anaconda3/envs/venv1/TestInvoice.pdf")
这些应该有效。如果以上两个不起作用,请尝试这个。
import os.path
file_path = ("C:/Users/user/anaconda3/envs/venv1/TestInvoice.pdf")
isFile = os.path.isfile(file_path)
print(is_file)
如果打印出
False
,则Python无法定位文件,然后按照这个教程进行操作。如果打印出 True
,请尝试安装 Java 并将其放入 PATH 中。 Tabula 是 tabula-java 的简单 Python 包装器,它可以读取 PDF 中的表格,然后更改其格式。因为它是 Java 的包装器,所以你应该安装以下两件事:
一旦两者都具备,它就应该可以工作。如果没有,我不知道如何解决这个问题。