我是python的新手。我试图解析.docx文件并将每个段落复制到新的.csv文件中的单个行。
我能够准确地计算段落的数量,以及打印整个文档,但是在尝试迭代文档来解析每个段落时我收到错误。
所以你可以从安装名为“docx”的软件包开始(如果你有python2的python2或'pip install python-docx',请在你的终端或命令行上执行'pip install docx')。
然后,您可以运行以下代码:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
我希望它有所帮助。 BR