。NET MS Interop Word不在UTF8网页中保存文档

问题描述 投票:0回答:1

注意:我用于测试的示例文档可以位于:http://ftp.3gpp.org//Specs/archive/38_series/38.413/38413-100.zip

问题

我正在尝试使用以下代码将MS Word 97-2003文档(.doc)转换为UTF-8网页:

var wordApp = new Word.Application();
var doc = wordApp.Documents.Open("input.doc");
Console.WriteLine(doc.TextEncoding); // msoEncodingWestern
doc.SaveEncoding = MsoEncoding.msoEncodingUTF8;
doc.WebOptions.Encoding = MsoEncoding.msoEncodingUTF8;
doc.SaveAs2("output.htm", WdSaveFormat.wdFormatFilteredHTML, Encoding: MsoEncoding.msoEncodingUTF8);
doc.Close();
wordApp.Quit();

问题是文档包含某个字符,该字符在网页中显示不正确:

在文档中>>

enter image description here

在网页中

enter image description here

(信息)手动方式

有关信息,如果我以如下方式手动执行上述操作,则箭头字符将在网页中正确显示。

enter image description here

注意:我用于测试的示例文档可以在以下位置找到:http://ftp.3gpp.org//Specs/archive/38_series/38.413/38413-100.zip问题我正在尝试转换MS Word 97 -2003文档(.doc)转换为UTF -...

.net office-interop
1个回答
-1
投票

[当您看到正确处理数字的单词和数字混合排序时,这是因为排序更智能,最重要的是,它仍然通常只在string的开头或结尾起作用。

© www.soinside.com 2019 - 2024. All rights reserved.