以字符串的形式将全文读成列表,而不是每段。

问题描述 投票:0回答:1

我在docx文档中阅读,并使用这段代码将每个段落作为一个字符串追加到一个列表中。

from docx import Document
paragraphs = []

document = Document('/path to/*.docx')
for para in document.paragraphs:
    para = para.text
    paragraphs.append(para)

而不是每段都读,我想把整个文本读成一个字符串,然后把它追加到一个列表中。我要如何修改上面的代码?

python string list docx
1个回答
2
投票

你可以简单地将所有的段落连接到一个变量中,然后你可以通过以下方式追加将完整的文本存储到一个列表中。

from docx import Document
text_com=""
paragraphs = []

document = Document('/path to/*.docx')
for para in document.paragraphs:
    text_com += para.text

paragraphs.append(text_com)
© www.soinside.com 2019 - 2024. All rights reserved.