每当我看到其他人都会分享的问题,以及实现起来很有趣的解决方案时,它通常已经被解决了。我认为在我深入到编码之前,最好先停下来,做一个搜索。
情况是这样的:您可以将office文档的某些部分复制并粘贴到visual studio HTML编辑器中。问题是,它创建的HTML文本如下所示:
<tr style="mso-yfti-irow:0;mso-yfti-firstrow:yes">
                <td style="border:solid windowtext 1.0pt;mso-border-alt:solid windowtext .5pt;
   padding:0cm 5.4pt 0cm 5.4pt" valign="top">
                    <p align="left" class="MsoNormal" 
                        style="text-align:left;tab-stops:center 216.0pt right 432.0pt">
                        <b style="mso-bidi-font-weight:normal"><span lang="EN-US">ID<o:p></o:p></span></b></p>
                </td>
                <td style="border:solid windowtext 1.0pt;border-left:none;
   mso-border-left-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;
   padding:0cm 5.4pt 0cm 5.4pt" valign="top">对于机器来说很好,但这并不是真正的人类可读的。我敢打赌,这可以通过找到重复的样式并从中创建CSS类来清理。一个计算机程序可以很容易地做到这一点。
我可以运行这个程序,然后我就可以拥有漂亮的、易于维护的HTML,它看起来就像我的Word文档。
(是的,我知道我可以只编辑Word文档,然后将其复制粘贴到HTML中,或者将其另存为HTML文件。但这并不等同于事后手工编辑)。
不管怎样,有没有人知道有这样的程序?
(后来编辑)我发现我问的问题是this one的复制品。
发布于 2009-05-08 06:50:33
HTML Tidy做到了!它还与常见的文本编辑器(如Notepad++或UltraEdit)集成,并提供清理Office web标记的选项。您将需要设置word-2000 boolean flag to true
此外,Jeff Atwood还在博客中介绍了这个问题,并介绍了他自己的C# 2.0解决方案in this article。
发布于 2009-05-08 06:51:01
我会尝试使用HTML:http://tidy.sourceforge.net/,另一个选择是将您的word文档粘贴到TinyMCE中,然后保存您的HTML。
发布于 2009-05-08 09:31:49
您可能希望认真考虑将粘贴为纯文本作为您的简化工具。权衡一下重新应用标记需要多长时间...你可能会发现它没有你想象的那么痛苦。
https://stackoverflow.com/questions/838512
复制相似问题