首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >清除从Word转换的HTML文档中的多余标签

清除从Word转换的HTML文档中的多余标签
EN

Stack Overflow用户
提问于 2016-07-13 19:06:23
回答 0查看 81关注 0票数 1

我有一个大的HTML文档产生后的Word到HTML的转换。HTML代码包含大量的额外标签。我想清除额外的标签与正则表达式。我使用的是UltraEdit编辑器(v11.20)。我尝试了一些正则表达式来查找html中所需的位置,但对我来说不起作用。(例如'*')

以下是代码示例:

代码语言:javascript
运行
复制
<P LANG="en-US" CLASS="western" ALIGN=JUSTIFY STYLE="margin-left: -0.49in; margin-right: -0.59in; text-indent: 0.3in; margin-bottom: 0in">
<FONT COLOR="#943634">       </FONT><FONT COLOR="#943634"><FONT FACE="Arial, sans-serif"><FONT SIZE=5 STYLE="font-size: 20pt"><B> TEXT TEXT</B></FONT></FONT></FONT></P>

我想使用正则表达式将其替换为

代码语言:javascript
运行
复制
<h1> TEXT TEXT TEXT</h1>

注意,里面有一个空格

<font color="#943634"> </font>标签

此外,<B> </B>标记内的文本可以很长,并且可以移动到新行。

EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38349919

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档