这是我到目前为止所做的:
from docx import Document
document = Document('filename.docx')
dic = {
'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'}
for p in document.paragraphs:
inline = p.runs
for i in range(len(inline)):
text = inline[i].text
for key in dic.keys():
if key in text:
text=text.replace(key,dic[key])
inline[i].text = text
document.save('new.docx')
但是当她需要替换一个单词时,这个功能似乎工作正常,但是当她需要替换句子时,它不起作用(这里是2021年10月18日)/
有什么想法为什么句子不起作用吗?
问题源于这样一个事实:您正在阅读的部分句子实际上处于不同的运行状态。
正如 scanny 在 this 帖子中所述:
因此,运行可以在任意位置有效地分解段落文本,甚至每个字符运行一次。简而言之,Word 并不尝试跟踪句子;而是尝试跟踪句子。如果你看到一个跑步,那是一个纯粹巧合的句子。
解决此问题的一个简单方法是使用
paragraph.text
而不是 inline.text
进行搜索和替换
from docx import Document
document = Document('test.docx')
dic = {
'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'
}
for p in document.paragraphs:
for key in dic.keys():
if key in p.text:
p.text = p.text.replace(key,dic[key])
document.save('new.docx')
问题是这不会携带先前文本的格式或将新格式应用于新文本