注意:我用于测试的示例文档可以位于:http://ftp.3gpp.org//Specs/archive/38_series/38.413/38413-100.zip
我正在尝试使用以下代码将MS Word 97-2003文档(.doc)转换为UTF-8网页:
var wordApp = new Word.Application();
var doc = wordApp.Documents.Open("input.doc");
Console.WriteLine(doc.TextEncoding); // msoEncodingWestern
doc.SaveEncoding = MsoEncoding.msoEncodingUTF8;
doc.WebOptions.Encoding = MsoEncoding.msoEncodingUTF8;
doc.SaveAs2("output.htm", WdSaveFormat.wdFormatFilteredHTML, Encoding: MsoEncoding.msoEncodingUTF8);
doc.Close();
wordApp.Quit();
问题是文档包含某个字符,该字符在网页中显示不正确:
在文档中>>
在网页中
有关信息,如果我以如下方式手动执行上述操作,则箭头字符将在网页中正确显示。
注意:我用于测试的示例文档可以在以下位置找到:http://ftp.3gpp.org//Specs/archive/38_series/38.413/38413-100.zip问题我正在尝试转换MS Word 97 -2003文档(.doc)转换为UTF -...
[当您看到正确处理数字的单词和数字混合排序时,这是因为排序更智能,最重要的是,它仍然通常只在string的开头或结尾起作用。