前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java利用poi-tl实现富文本HTML转Word[通俗易懂]

Java利用poi-tl实现富文本HTML转Word[通俗易懂]

作者头像
全栈程序员站长
发布2022-11-10 16:22:10
5.5K0
发布2022-11-10 16:22:10
举报
文章被收录于专栏:全栈程序员必看

废话不多,直接上码

一、说明

1、jdk1.8 2、springboot项目 3、测试包下目录,如下图:

在这里插入图片描述
在这里插入图片描述

4、模板文件如下: html2wordtemplate.docx –> https://download.csdn.net/download/wdy_2099/19686795 5、html如下:

代码语言:javascript
复制
2021年6月10日,重庆QGhappy和佛山GK展开败者组第二轮对决,最终重庆QG4:3佛山GK拿下胜利。
重庆QGhappy确认晋级2021年KPL春季赛季后赛败者组·第三轮,佛山GK遗憾告别2021年KPL春季赛舞台。
<br/><img src="http://inews.gtimg.com/newsapp_bt/0/13638266215/641" style="max-width:100%;" width="50%"/><br/><b>图2&nbsp; 学校举办2020年全面从严治党工作会议暨中层干部培训会</b><br/>
二连击破,穿三无惧!
山城弟子无惧挑战,一穿五第二步完成!目标银龙还剩三步,败者组第三轮,我们一起期待重庆QG的精彩表现!
<br/><img src="http://inews.gtimg.com/newsapp_bt/0/13638266213/641" style="max-width:100%;" width="50%"/><br/><b>图2&nbsp; 学校举办2020年全面从严治党工作会议暨中层干部培训会</b><br/>
春之GK暂别赛场,夏日定要打破魔咒突破自己!
不止要有巅峰手法,更要有重头再来的勇气!2021年王者荣耀世界冠军杯选拔赛,我们一起期待夏日的佛山GK秀翻全场!
集合!新十代!
2021年KPL王者荣耀职业联赛春季赛季后赛6月3日-6月20日每日19点准时开播,召唤师们可通过王者荣耀游戏内赛事专区、王者营地、王者荣耀官网观看直播;还可以登录官方播出平台哔哩哔哩、斗鱼直播、虎牙直播、快手、企鹅电竞、腾讯体育、腾讯视频、腾讯微视收看全程比赛直播和回放,电视大屏观赛用哒啵电竞、云视听极光!

二、核心pom引入

【注意:】依赖的版本,不能乱改,可能会有冲突。

代码语言:javascript
复制
 	<properties>
<poi.version>4.1.2</poi.version>
<hutool.version>4.6.10</hutool.version>
<guava.version>20.0</guava.version>
<commons-lang3.version>3.9</commons-lang3.version>		
</properties>
<dependencies>
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>${guava.version}</version>
</dependency>
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<version>${commons-lang3.version}</version>
</dependency>
<dependency>
<groupId>cn.hutool</groupId>
<artifactId>hutool-all</artifactId>
<version>${hutool.version}</version>
</dependency>
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.12.1</version>
</dependency>
<!--poi 类 -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>${poi.version}</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>${poi.version}</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml-schemas</artifactId>
<version>${poi.version}</version>
</dependency>
<!--word工具类-->
<dependency>
<groupId>com.deepoove</groupId>
<artifactId>poi-tl</artifactId>
<version>1.9.1</version>
<exclusions>
<exclusion>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
</exclusion>
</exclusions>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>ooxml-schemas</artifactId>
<version>1.4</version>
</dependency>
<!--html渲染插件-->
<dependency>
<groupId>io.github.draco1023</groupId>
<artifactId>poi-tl-ext</artifactId>
<version>0.3.3</version>
<exclusions>
<exclusion>
<groupId>com.deepoove</groupId>
<artifactId>poi-tl</artifactId>
</exclusion>
<exclusion>
<groupId>org.apache.poi</groupId>
<artifactId>ooxml-schemas</artifactId>
</exclusion>
</exclusions>
</dependency>
<!--样式依赖-->
<dependency>
<groupId>org.w3c.css</groupId>
<artifactId>sac</artifactId>
<version>1.3</version>
</dependency>
<dependency>
<groupId>net.sourceforge.cssparser</groupId>
<artifactId>cssparser</artifactId>
<version>0.9.29</version>
</dependency>
<!--合并word,free免费版可以用,否则收费-->
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>3.9.0</version>
</dependency>
</dependencies>

三、Java测试类

代码语言:javascript
复制
import cn.hutool.core.io.FileUtil;
import com.deepoove.poi.XWPFTemplate;
import com.deepoove.poi.config.Configure;
import com.deepoove.poi.data.PictureRenderData;
import com.deepoove.poi.policy.PictureRenderPolicy;
import com.deepoove.poi.xwpf.NiceXWPFDocument;
import com.spire.doc.Document;
import com.spire.doc.DocumentObject;
import com.spire.doc.Section;
import com.spire.doc.FileFormat;
import org.apache.commons.io.IOUtils;
import org.apache.commons.lang3.StringUtils;
import org.ddr.poi.html.HtmlRenderPolicy;
import java.io.*;
import java.util.*;
/** * java生成word * * @author wangdy * @date 2021-06-15 11:16 */
public class Java2Word { 

public static void main(String[] args) throws IOException { 

// html渲染插件
HtmlRenderPolicy htmlRenderPolicy = new HtmlRenderPolicy();
// 第一个案例 
Configure configure = Configure.builder()
// 注册html解析插件
.bind("content", htmlRenderPolicy)
// .bind("content2", htmlRenderPolicy)
.build();
// 映射数据Map
Map<String, Object> data = new HashMap<>();
data.put("title", "我是一个案例名称1");
data.put("keywords", "我是一个案例keywords");
data.put("cty", "我是一个案例cty");
data.put("content", readFile("/demo1.html"));
// 读取模板文件,并渲染数据
XWPFTemplate template = XWPFTemplate.compile(getResourceInputStream("/html2wordtemplate.docx"), configure).render(data);
// 写入文件
template.writeToFile("demo1.docx");
template.close();
// 第二个案例
Configure configure1 = Configure.builder()
.bind("content", htmlRenderPolicy)
.build();
Map<String, Object> data1 = new HashMap<>();
data1.put("title", "我是一个案例名称2");
data1.put("keywords", "我是一个案例keywords2");
data1.put("cty", "我是一个案例分类2");
data1.put("content", readFile("/demo2.html"));
XWPFTemplate template1 = XWPFTemplate.compile(getResourceInputStream("/html2wordtemplate.docx"), configure1).render(data1);
template1.writeToFile("demo2.docx");
template1.close();
// 合并word
//加载需要合并的两个文档
Document doc1 = new Document("demo1.docx");
Document doc2 = new Document("demo2.docx");
//获取文档1的最后一节
Section lastsec = doc1.getLastSection();
//遍历文档2的所有段落内容,添加到文档1
for (Section section : (Iterable<Section>) doc2.getSections()) { 

for (DocumentObject obj : (Iterable<DocumentObject>) section.getBody().getChildObjects()) { 

lastsec.getBody().getChildObjects().add(obj.deepClone());
}
}
//保存合并后的文档
doc1.saveToFile("ALL-Word.docx", FileFormat.Docx);
}
/** * 读取文件内容 * * @param resourceFile 文件路径 * @return 文件内容 * @throws IOException IO异常 * import org.apache.commons.io.IOUtils; */
public static String readFile(String resourceFile) throws IOException { 

try (InputStream inputStream = FileReader.class.getResourceAsStream(resourceFile)) { 

return IOUtils.toString(inputStream, StandardCharsets.UTF_8);
}
}
}

好了,运行看结果吧。

【补充1:】

如果html里有table,则原生table加边框样式不生效,需要添加td样式,如将<td>整体替换为<td style="border:1px solid #ccc;">才可以生效,如下效果:

在这里插入图片描述
在这里插入图片描述

【补充2】:

poi-tl-ext 0.3.3的版本,在实际用的过程中,对于如下html解析有误,升级到0.3.18解决问题。 原HTML如下:

代码语言:javascript
复制
 <p>&nbsp;</p>
<p class="MsoNormal" style="text-align: left; text-indent: 21.0pt; line-height: 20.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 10.5pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">根据省人民政府xx政发<span lang="EN-US">(1992)18</span>号文附件六《xxx一九九二年基本建设计划》,现将一九九二年xx基本建设计划下达给你们<span lang="EN-US">(</span>见附表<span lang="EN-US">)</span>,请据此执行</span></p>
<p class="MsoNormal" style="text-align: left; text-indent: 21.0pt; line-height: 20.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 10.5pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">附<span lang="EN-US">:</span>xx省一九九二年xx基本建设计划表</span></p>
<p class="MsoNormal" style="text-align: right; line-height: 20.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="right"><span style="font-size: 10.5pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">单位:万元、平方米</span></p>
<table style="border-collapse: collapse; width: 100%; height: 66px;" border="1">
<tbody>
<tr style="height: 22px;">
<td style="width: 11.0637%; height: 44px;" rowspan="2"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">单位名称</span></td>
<td style="width: 11.0637%; height: 44px; text-align: center;" rowspan="2"><span style="font-size: 9.0pt; mso-bidi-font-size: 11.0pt; font-family: 宋体; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">项目</span></td>
<td style="width: 11.0637%; height: 44px; text-align: center;" rowspan="2"><span style="font-size: 9.0pt; mso-bidi-font-size: 11.0pt; font-family: 宋体; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">建设性质</span></td>
<td style="width: 11.0637%; height: 44px; text-align: center;" rowspan="2"><span style="font-size: 9.0pt; mso-bidi-font-size: 11.0pt; font-family: 宋体; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">建筑面积</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;" colspan="3"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">一九九二年计划投资</span></td>
<td style="width: 11.0637%; height: 44px; text-align: center;" rowspan="2">备注</td>
</tr>
<tr style="height: 22px;">
<td style="width: 11.0637%; height: 22px; text-align: center;"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">合计</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">统筹投资</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">省财政自筹</span></td>
</tr>
<tr style="height: 22px;">
<td style="width: 11.0637%; height: 22px; text-align: center;"><span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">xx工学院</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">图书馆及电教中心</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">农工住房拆迁</span></p>
<span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">待安排</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">图书馆及电教中心</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">农工住房拆迁</span></p>
<span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">待安排</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;"><span lang="EN-US" style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">9800</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">520</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">200</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">100</span></p>
<span lang="EN-US" style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">220</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">210</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">200</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">&nbsp;</span></p>
<span lang="EN-US" style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">10</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">310</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">&nbsp;</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">100</span></p>
<span lang="EN-US" style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">210</span></td>
<td style="width: 11.0637%; height: 22px; text-align: center;">
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">含预拨投资<span lang="EN-US">100</span>万元</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">&nbsp;</span></p>
<p class="MsoNormal" style="text-align: left; line-height: 12.0pt; mso-line-height-rule: exactly; mso-pagination: widow-orphan;" align="left"><span lang="EN-US" style="font-size: 9.0pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt;">&nbsp;</span></p>
<span style="font-size: 9.0pt; font-family: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">还工程欠款</span></td>
</tr>
</tbody>
</table>
<p class="MsoNormal"><span lang="EN-US">&nbsp;</span></p>
<p>&nbsp;</p>
<p>&nbsp;</p>

HTML浏览器解析原样:

在这里插入图片描述
在这里插入图片描述

升级版本前生成word结果:发现合计等表格没有了,而且备注下面的边框少了一个。

在这里插入图片描述
在这里插入图片描述

升级版本后生成word结果:

在这里插入图片描述
在这里插入图片描述

END

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/184088.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月9日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、说明
  • 二、核心pom引入
  • 三、Java测试类
  • 【补充1:】
  • 【补充2】:
  • END
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档