如何用python有效替换word文档中的句子

问题描述 投票:0回答:2

这是我到目前为止所做的:

from docx import Document

document = Document('filename.docx')

dic = {
    'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'}
for p in document.paragraphs:
    inline = p.runs
    for i in range(len(inline)):
        text = inline[i].text
        for key in dic.keys():
            if key in text:
                 text=text.replace(key,dic[key])
                 inline[i].text = text


document.save('new.docx')

但是当她需要替换一个单词时,这个功能似乎工作正常,但是当她需要替换句子时,它不起作用(这里是2021年10月18日)/

有什么想法为什么句子不起作用吗?

python python-3.x docx python-docx
2个回答
2
投票

问题源于这样一个事实:您正在阅读的部分句子实际上处于不同的运行状态。

正如 scanny 在 this 帖子中所述:

因此,运行可以在任意位置有效地分解段落文本,甚至每个字符运行一次。简而言之,Word 并不尝试跟踪句子;而是尝试跟踪句子。如果你看到一个跑步,那是一个纯粹巧合的句子。

解决此问题的一个简单方法是使用

paragraph.text
而不是
inline.text

进行搜索和替换
from docx import Document

document = Document('test.docx')

dic = {
    'Stack':'Stack Overflow',
    'October 18 2021' : 'Actual Date'
}
for p in document.paragraphs:
    for key in dic.keys():
        if key in p.text:
            p.text = p.text.replace(key,dic[key])

document.save('new.docx')

0
投票

问题是这不会携带先前文本的格式或将新格式应用于新文本

© www.soinside.com 2019 - 2024. All rights reserved.