我有以下HTML:
<html><body><p>n<sup>th</sup></p></body></html>
我使用的是命令:
$ libreoffice --转换-为docx:"MS Word 2007XML“test.html
将该HTML转换为DOCX文件。但是,我注意到生成的DOCX文件实际上并不包含<sup>
标记。它看起来是在使用位置和大小来复制<w:vertAlign>
标签:
<w:position w:val="8"/><w:sz w:val="19"/>
我需要知道的是如何让libreoffice放入<w:vertAlign>
标签,而不是使用位置和大小。
附加信息:
我在使用粗体和斜体(<strong><em>
)时遇到了类似的问题,但是如果将strong
和em
标签分别转换为b
和i
标签,则可以正确地进行转换。
发布于 2014-06-15 01:35:10
如果你想编辑超文本标记语言,最好使用适合编辑超文本标记语言的工具,比如Notepad++或Sublime。
如果您出于特定原因需要将HTML作为LibreOffice文档,则可以在记事本中打开该HTML文件,并将其另存为扩展名为.txt的文本文件。这应该允许您在LibreOffice中打开文档。
发布于 2014-07-26 19:37:13
你可以尝试使用像TinyMCE(http://www.tinymce.com/)这样的WYSIWYG(所见即所得)编辑器。有很多在线应用程序,你也可以找到一些桌面应用程序。但是如果你想把它转换成docx,你可以试试这个http://htmltodocx.codeplex.com/,它是用php写的,使用的是PHPWord,非常高效。
发布于 2014-08-11 16:30:35
只需创建一个Python脚本,在需要的地方将不需要的标记替换为<w:vertAlign>
标记。
https://stackoverflow.com/questions/23817660
复制相似问题