首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用libreoffice将HTML转换为DOCX时丢失上标标签

使用libreoffice将HTML转换为DOCX时丢失上标标签
EN

Stack Overflow用户
提问于 2014-05-23 05:51:07
回答 4查看 1.9K关注 0票数 19

我有以下HTML:

<html><body><p>n<sup>th</sup></p></body></html>

我使用的是命令:

$ libreoffice --转换-为docx:"MS Word 2007XML“test.html

将该HTML转换为DOCX文件。但是,我注意到生成的DOCX文件实际上并不包含<sup>标记。它看起来是在使用位置和大小来复制<w:vertAlign>标签:

<w:position w:val="8"/><w:sz w:val="19"/>

我需要知道的是如何让libreoffice放入<w:vertAlign>标签,而不是使用位置和大小。

附加信息:

我在使用粗体和斜体(<strong><em>)时遇到了类似的问题,但是如果将strongem标签分别转换为bi标签,则可以正确地进行转换。

EN

回答 4

Stack Overflow用户

发布于 2014-06-15 01:35:10

如果你想编辑超文本标记语言,最好使用适合编辑超文本标记语言的工具,比如Notepad++或Sublime。

如果您出于特定原因需要将HTML作为LibreOffice文档,则可以在记事本中打开该HTML文件,并将其另存为扩展名为.txt的文本文件。这应该允许您在LibreOffice中打开文档。

票数 1
EN

Stack Overflow用户

发布于 2014-07-26 19:37:13

你可以尝试使用像TinyMCE(http://www.tinymce.com/)这样的WYSIWYG(所见即所得)编辑器。有很多在线应用程序,你也可以找到一些桌面应用程序。但是如果你想把它转换成docx,你可以试试这个http://htmltodocx.codeplex.com/,它是用php写的,使用的是PHPWord,非常高效。

票数 1
EN

Stack Overflow用户

发布于 2014-08-11 16:30:35

只需创建一个Python脚本,在需要的地方将不需要的标记替换为<w:vertAlign>标记。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23817660

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档