由于“奇怪的块”,无法通过Python从docx文件中获取文本

问题描述 投票:0回答:1

enter image description here我正在尝试从Word文档中获取文本,但我做不到,在某些时候我查看了文档,发现文本出现在一些奇怪的“块”中,并且没有有关如何使用它的信息,帮助

from docx import Document

doc = Document('XXXXXXXXXXXXXXXX.docx')
for para in doc.paragraphs:
    print(para.text)

python python-3.x ms-word
1个回答
0
投票

尝试使用其他库,例如“python-docx2txt”或“texttract”。因为 docx 可能不支持 Word 文档中的所有格式。

© www.soinside.com 2019 - 2024. All rights reserved.