我正在尝试删除包含"{Some Text}"
的段落。下面的方法可以做到这一点,但是我注意到在删除段落之后,剩下了空的段落元素。
我如何以编程方式删除<w:p />
元素?
下面是我最初用来删除段落的内容。
using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(file, true))
{
MainDocumentPart mainPart = wordDoc.MainDocumentPart;
Document D = mainPart.Document;
foreach (Paragraph P in D.Descendants<Paragraph>())
{
if (P.InnerText.Contains("{SomeText}"))
{
P.RemoveAllChildren();
//P.Remove(); //doesn't remove
}
}
D.Save();
}
这是document.xml看起来像后记的样子:
<w:p />
<w:p />
<w:p />
<w:p />
<w:p />
<w:p />
<w:p />
这里的问题:
foreach (Paragraph P in D.Descendants<Paragraph>())
{
if (P.InnerText.Contains("{SomeText}"))
{
P.Remove(); //doesn't remove
}
}
是您在尝试迭代集合时仍要从集合中删除它。出于某些奇怪的原因,OpenXML SDK实际上并未在此处引发异常,它只是静默退出了foreach
循环。附加调试器并逐步完成将向您显示。解决方法很简单:
foreach (Paragraph P in D.Descendants<Paragraph>().ToList())
{
if (P.InnerText.Contains("{SomeText}"))
{
P.Remove(); //will now remove
}
}
通过添加ToList()
,您正在将段落复制(浅表复制)到单独的列表中并遍历该列表。现在,当您删除段落时,该段落将从D.Descendants<Paragraph>()
集合中删除,但不会从列表中删除,并且迭代将继续。
上面的答案帮助我创建了以下代码片段,该片段从开始到结束(不包括开始和结束)删除了段落。当必须使用模板作为输入,但又不想在输出中使用模板的某些部分时,此方法非常方便。
public void RemoveParagraphsFromDocument(string begin, string end)
{
using (var wordDoc = WordprocessingDocument.Open(OutputPath, true))
{
var mainPart = wordDoc.MainDocumentPart;
var doc = mainPart.Document;
var paragraphs = doc.Descendants<Paragraph>().ToList();
var beginIndex = paragraphs.FindIndex(par => par.InnerText.Equals(begin));
var endIndex = paragraphs.FindIndex(par => par.InnerText.Equals(end));
for (var i = beginIndex + 1; i < endIndex; i++)
{
paragraphs[i].Remove();
}
doc.Save();
}
}