如何在python docx中使用正则表达式?

问题描述 投票:-1回答:1

我想在docx文档中找到特定的正则表达式。我安装了python-docx,可以在文本中找到字符串。但是,我想使用正则表达式。

到目前为止,我的代码是:

import re
from docx import Document
doc = Document('categoriemanzoni.docx')
match = re.search(r"\[(['prima']+(?!\S))", doc)

for paragraph in doc.paragraphs:
    paragraph_text = paragraph.text
    if match in paragraph.text:
        print('ok')

对我来说,它似乎并没有阅读所有段落。如何解决?

python regex docx python-docx
1个回答
1
投票

您的代码在错误的位置应用了正则表达式(本身是错误的)。您可能想要这样的东西:

import re
from docx import Document
doc = Document('categoriemanzoni.docx')
regex = re.compile(r"\[prima(?!\S)")

for paragraph in doc.paragraphs:
    if regex.search(paragraph.text):
        print('ok')
© www.soinside.com 2019 - 2024. All rights reserved.