我如何从python中的word(docx)文件读取。我可以读取txt文件,但不能对MS Office Word文档进行相同的操作。有什么建议吗?
请参阅此允许读取docx文件的库https://python-docx.readthedocs.io/en/latest/
您应该使用PyPi上可用的python-docx库。然后您可以使用以下]
doc = docx.Document('myfile.docx')
allText = []
for docpara in doc.paragraphs:
allText.append(docpara.text)