如何将.docx文件中的每个段落复制到.csv文件中的新行?

问题描述 投票:0回答:1

我是python的新手。我试图解析.docx文件并将每个段落复制到新的.csv文件中的单个行。

我能够准确地计算段落的数量,以及打印整个文档,但是在尝试迭代文档来解析每个段落时我收到错误。

python docx python-docx
1个回答
1
投票

所以你可以从安装名为“docx”的软件包开始(如果你有python2的python2或'pip install python-docx',请在你的终端或命令行上执行'pip install docx')。

然后,您可以运行以下代码:

from docx import Document
import pandas as pd

document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
    print(para.text)
    df.loc[len(df)] = para.text
print(df)

我希望它有所帮助。 BR

© www.soinside.com 2019 - 2024. All rights reserved.