我有一个数字,将被转换为HTML的Word文档。它需要在Word文档中的段落应转换为<p>
元素。
一些测试与Microsoft Office API的SaveAs方法将文件转换为HTML后,我实现了与手动换行符的段落(按“Shift键进入”休息时间)不能被放置在一个分离<p>
元素,而不是段落在同一<p>
元件分组。
为了将它们分开,我一直在努力与执行转换前的“Enter”键/回车替换“按住Shift键并输入”换行。但是,我无法找到一个合适的方式做换行符替换工作。我曾尝试在SaveAs方法WdLineEndingType参数,但似乎没有效果的问题。
对于那些希望在MS Word:使用控制-H {查找和替换。
查找特殊字符:手动换行符(^ L,小写的L)
替换为:段落标记(^ P)
全部替换会做整个文档。
编辑:更改为小写字符。
在MS-字办公室API提供了Range对象查找功能,使搜索和替换字符串。
以下代码是找到手动换行符(“^ L”)与回车(“^ P”)。
Range r = oDoc.Content;
r.WholeStory();
r.Find.Execute("^l", ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, "^p", WdReplace.wdReplaceAll);
然后使用另存为word文档转换为HTML,它会正确放置在<p>
元件分别线。
段落标记(段落标记)
^ p或^ 13(未在查找内容时使用通配符选项是打开盒子工作)