我在docx文档中阅读,并使用这段代码将每个段落作为一个字符串追加到一个列表中。
from docx import Document
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
para = para.text
paragraphs.append(para)
而不是每段都读,我想把整个文本读成一个字符串,然后把它追加到一个列表中。我要如何修改上面的代码?
你可以简单地将所有的段落连接到一个变量中,然后你可以通过以下方式追加将完整的文本存储到一个列表中。
from docx import Document
text_com=""
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
text_com += para.text
paragraphs.append(text_com)