我正在编写一些C# VSTO代码,它读取Microsoft文档并将其保存到过滤后的HTML中。当我对通用Word文档执行此功能时,html文件的输出使用Windows字符集,如下所示:
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
如果我打开一个文档并转到File-> Options ->Advanced->Web,我可以选择UTF8,得到的过滤后的html文档输出如下所示:
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
我想用utf-8编写c#代码,将任何 Word文档保存到过滤后的html中。在做了一些研究之后,我发现一些人说"SaveAs2“功能不起作用(尽管微软把它作为一个特性来记录)。这意味着,这个代码对我不起作用:
doc.SaveAs2("C:\\Temp\\Test.htm", MsWord.WdSaveFormat.wdFormatFilteredHTML, Encoding: "65001");
(注:我试着把65001写在引号里,没有引号。)既不抛出错误,也不起作用)。
接下来,我继续为文档设置web选项,如下所示:
doc = app.Documents.Open("C:\\Temp\\Test.docx");
doc.WebOptions.Encoding = Microsoft.Office.Core.MsoEncoding.msoEncodingUTF8;
doc.SaveAs2(destFile, MsWord.WdSaveFormat.wdFormatFilteredHTML);
据我所知,上述代码执行与手动打开文件、转到文件->选项、设置为UTF-8并将文件保存为过滤的html相同的功能,但是输出仍然如下所示:
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
是否有一种方法可以强迫Microsoft将文件输出到UTF-8,而不必首先手动配置文档?
发布于 2015-12-02 16:24:56
在撰写本文时,还不清楚我是否遇到了特定版本的Microsoft (Word Online)或VSTO模板的错误,但我将在这里回答是什么使我做到了这一点。
如果此代码不起作用:
doc = app.Documents.Open("C:\\Temp\\Test.docx");
doc.WebOptions.Encoding = Microsoft.Office.Core.MsoEncoding.msoEncodingUTF8;
doc.SaveAs2("C:\\Temp\\Test.htm", MsWord.WdSaveFormat.wdFormatFilteredHTML);
然后,更改代码以刷新文档的字段,如下所示:
doc = app.Documents.Open("C:\\Temp\\Test.docx");
doc.Fields.Update(); // ** this is the new line of code.
doc.WebOptions.Encoding = Microsoft.Office.Core.MsoEncoding.msoEncodingUTF8;
doc.SaveAs2("C:\\Temp\\Test.htm", MsWord.WdSaveFormat.wdFormatFilteredHTML);
发布于 2019-11-25 18:24:06
在Visual中,您必须添加一个引用:
在你的项目中:
'MyProject‘>解决方案资源管理器>引用>添加引用> COM >MicrosoftOffice16.0对象库
VS给出了一个非常神秘的错误,实际上无助于找到库。
https://stackoverflow.com/questions/34026716
复制相似问题