问使用libreoffice将HTML转换为DOCX时丢失上标标签
EN

Stack Overflow用户

提问于 2014-05-23 05:51:07

回答 4查看 1.9K关注 0票数 19

我有以下HTML：

<html><body>nth</body></html>

我使用的是命令：

$ libreoffice --转换-为docx:"MS Word 2007XML“test.html

将该HTML转换为DOCX文件。但是，我注意到生成的DOCX文件实际上并不包含标记。它看起来是在使用位置和大小来复制<w:vertAlign>标签：

<w:position w:val="8"/><w:sz w:val="19"/>

我需要知道的是如何让libreoffice放入<w:vertAlign>标签，而不是使用位置和大小。

附加信息：

我在使用粗体和斜体()时遇到了类似的问题，但是如果将strong和em标签分别转换为b和i标签，则可以正确地进行转换。

html

converter

docx

libreoffice

回答 4

Stack Overflow用户

发布于 2014-06-15 01:35:10

如果你想编辑超文本标记语言，最好使用适合编辑超文本标记语言的工具，比如Notepad++或Sublime。

如果您出于特定原因需要将HTML作为LibreOffice文档，则可以在记事本中打开该HTML文件，并将其另存为扩展名为.txt的文本文件。这应该允许您在LibreOffice中打开文档。

票数 1

Stack Overflow用户

发布于 2014-07-26 19:37:13

你可以尝试使用像TinyMCE(http://www.tinymce.com/)这样的WYSIWYG(所见即所得)编辑器。有很多在线应用程序，你也可以找到一些桌面应用程序。但是如果你想把它转换成docx，你可以试试这个http://htmltodocx.codeplex.com/，它是用php写的，使用的是PHPWord，非常高效。

票数 1

Stack Overflow用户

发布于 2014-08-11 16:30:35

只需创建一个Python脚本，在需要的地方将不需要的标记替换为<w:vertAlign>标记。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/23817660

复制

相似问题

问使用libreoffice将HTML转换为DOCX时丢失上标标签
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用libreoffice将HTML转换为DOCX时丢失上标标签EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用libreoffice将HTML转换为DOCX时丢失上标标签
EN