我正在尝试从Word文档中获取文本,但我做不到,在某些时候我查看了文档,发现文本出现在一些奇怪的“块”中,并且没有有关如何使用它的信息,帮助
from docx import Document
doc = Document('XXXXXXXXXXXXXXXX.docx')
for para in doc.paragraphs:
print(para.text)
尝试使用其他库,例如“python-docx2txt”或“texttract”。因为 docx 可能不支持 Word 文档中的所有格式。