我目前正在尝试用 Python 编写一个函数,该函数允许我从 .docx 文件中提取文本。为此,我使用 python-docx 库。我的程序也做了它应该做的事情,至少当我在 Python 中创建一个 docx 文件,然后在这个文件上使用我的函数时,它会将文本返回给我。
但是,对于我修改或创建的.docx文件(word文档),它找不到路径并返回PackageNotFoundError。我上网检查我的文件是否是 zip 文件。我用 zipfile 做到了这一点,事实上我保存的 word 文档不是 zipfiles。这是怎么回事?再次验证一下我的python代码:
从 zipfile 导入 is_zipfile 导入docx
doc = docx.Document()
doc.add_paragraph(“你好”)
doc.save(test_path)
打印(is_zipfile(test_path))
//输出=真
如果我进入此 test_path,输入一个数字并保存 ->
打印(is_zipfile(测试路径)) //输出=假
现代 .docx 文档不再是 zip 文件吗?或者这里出了什么问题?
当谷歌搜索到处都写到word文档/.docx文件是zip文件。我认为这就是为什么库给我错误代码并且无法打开文件的问题。 我感谢每个试图提供帮助的人。谢谢
如果您想要对最终文档进行更多控制,或者想要更改现有文档,则需要使用文件名打开一个文档:
document = Document('existing-document-file.docx')
document.save('new-file-name.docx')