前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >java实现HTML转PDF

java实现HTML转PDF

作者头像
斯文的程序
发布2019-11-07 17:40:38
14.6K4
发布2019-11-07 17:40:38
举报
文章被收录于专栏:带你回家带你回家

效果图:

上图是 html 效果图

生成PDF效果图如下:

maven准备的jar包: 注意版本不要搞错!!搞错了是运行不了。

代码语言:javascript
复制
<dependency>  
                <groupId>com.itextpdf</groupId>  
                <artifactId>itextpdf</artifactId>  
                <version>5.5.9</version>
            </dependency>  
              
             <dependency>  
                <groupId>com.itextpdf.tool</groupId>  
                <artifactId>xmlworker</artifactId>  
                <version>5.5.9</version>
            </dependency>  
                       
            <dependency>  
                <groupId>com.itextpdf</groupId>  
                <artifactId>itext-asian</artifactId>  
                <version>5.2.0</version>
            </dependency>  
			
		<dependency>
		    <groupId>org.xhtmlrenderer</groupId>
		    <artifactId>flying-saucer-pdf-itext5</artifactId>
		    <version>9.0.3</version>
		</dependency>

java类:

代码语言:javascript
复制
package com.test;

import com.itextpdf.text.pdf.BaseFont;
import org.xhtmlrenderer.pdf.ITextFontResolver;
import org.xhtmlrenderer.pdf.ITextRenderer;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.OutputStream;

/**
 * 文件格式转换工具类
 *
 * @author lbj
 *
 * 2015-10-8 上午10:52:22
 */
public class FileTypeConvertUtil {

    /**
     * 将HTML转成PD格式的文件。html文件的格式比较严格
     * @param htmlFile
     * @param pdfFile
     * @throws Exception
     */
    // <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
    public static void html2pdf(String htmlFile, String pdfFile) throws Exception {
        // step 1
        String url = new File(htmlFile).toURI().toURL().toString();
        System.out.println(url);
        // step 2
        OutputStream os = new FileOutputStream(pdfFile);
        ITextRenderer renderer = new ITextRenderer();
        renderer.setDocument(url);

        // step 3 解决中文支持
        ITextFontResolver fontResolver = renderer.getFontResolver();
        if("linux".equals(getCurrentOperatingSystem())){
            fontResolver.addFont("/usr/share/fonts/chiness/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
        }else{
            fontResolver.addFont("c:/Windows/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
        }

        renderer.layout();
        renderer.createPDF(os);
        os.close();

        System.out.println("create pdf done!!");

    }

    public static String getCurrentOperatingSystem(){
        String os = System.getProperty("os.name").toLowerCase();
        System.out.println("---------当前操作系统是-----------" + os);
        return os;
    }


    public static void main(String[] args) {
        //        String htmlFile = "/home/lbj/sign.jsp";
        //        String pdfFile = "/home/lbj/sign.pdf";
        String htmlFile = "d:/table.html";
        String pdfFile = "d:/testoone2.pdf";
        try {
            FileTypeConvertUtil.html2pdf(htmlFile, pdfFile);
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

这里说下博主所踩过的坑:

1.simsun.ttc 文件找不到问题

windows 自带有这个文件 。但是linux 要自己去下载了 如果需要可以联系博主 (千万不要把windows s上的这个文件直接copy 到linux 系统上去哦)

备注:可能很多人看到simsun 这个文件是这个样子

其实就是这个样子。

2.中文显示问题:

这里很奇怪为什么引入了 中文字体为什么还是不能显示中文?

这里要注意了:要再你的html <body> 加上一个样式:

style = "font-family: SimSun;"

这样加了之后就会出现中文了。。

3.&nbsp; 问题(当然不知这种问题 还有 &gt;等一些特殊转义符号这里只罗列一种)

当文中出现这种字符的时候 会报错:

因为这个HTML 转PDF 对html代码规范要求非常严格所以这里的头部必须声明:

代码语言:javascript
复制
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">

以及其他的都要加</>结束

4.这里出现这样一个问题:

html 中这个换行是OK 的 但是转完PDF之后 是这种情况:

解决办法如下:

添加样式:

代码语言:javascript
复制
table {
			border-collapse: collapse;
			table-layout: fixed;
			word-break:break-all;
			font-size: 10px;
			width: 100%;
			text-align: center;
	}
	td {
		word-break:break-all;
		word-wrap : break-word;
	}

完美解决了!!

效果图:

另外这里还涉及到分页的情况以及纸张大小设置

代码语言:javascript
复制
@page {
		size: 7in 15.25in;
	}

这里是设置A4 纸张

代码语言:javascript
复制
body里加入
        <div id="footer" style="">  Page <span id="pagenumber"/> of <span id="pagecount"/> </div>
样式上加入
@page {
size:210mm 297mm;//纸张大小A4
margin: 0.25in;
-fs-flow-bottom: "footer";
-fs-flow-left: "left";
-fs-flow-right: "right";
border: thin solid black;
padding: 1em;
}
#footer {
font-size: 90%; font-style: italic;
position: absolute; top: 0; left: 0;
-fs-move-to-flow: "footer";
}
#pagenumber:before {
content: counter(page);
}
#pagecount:before {content: counter(pages);
}

代码:

参考文献:https://www.cnblogs.com/reese-blogs/p/5546806.html

http://blog.csdn.net/u010515155/article/details/76186728

附上html 代码:

代码语言:javascript
复制
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
  <meta charset="UTF-8"/>
  <title>表格样式</title>
  <meta name="viewport" content="initial-scale=1, maximum-scale=1, user-scalable=no, width=device-width"/>
  <link rel="stylesheet" href="https://static.loyalvalleycapital.com/web/css/frame.css"/>
  <style>
  table.table-separate th{
    font-weight:bold;
    font-size:14px;
    border-top:1px solid #F3EDE9 !important;
  }
  table.table-separate td{
    padding: 13px 0;
    font-weight:100;
  }
  .table-separate td.tit{
    background-color: #f4f9fe;
    font-weight:normal;
    padding:22px 0;
    width:15%;
  }
  .table-separate td.cont{
    text-align: left;
    padding:16px 22px;
    width:85%;
    line-height:175%;
  }
  .table-separate.no-border th{
    border:none;
    text-align: left;
  }
  .table-separate.no-border td{
    text-align: left;
    border:none;
  }
 
	table {
			border-collapse: collapse;
			table-layout: fixed;
			word-break:break-all;
			font-size: 10px;
			width: 100%;
			text-align: center;
	}
	td {
		word-break:break-all;
		word-wrap : break-word;
	}
	@page {
		size:210mm 297mm;//纸张大小A4
		margin: 0.25in;
		-fs-flow-bottom: "footer";
		-fs-flow-left: "left";
		-fs-flow-right: "right";
		padding: 1em;
		}
		#footer {
		font-size: 90%; font-style: italic;
		position: absolute; top: 0; left: 0;
		-fs-move-to-flow: "footer";
		}
		#pagenumber:before {
		content: counter(page);
		}
		#pagecount:before {content: counter(pages);
		}
</style>
</head>
<body class="bg-white pb-3"  style = "font-family: SimSun;">
 <div id="footer" style="">  Page <span id="pagenumber"/> of <span id="pagecount"/> </div>
<div style="max-width:600px;margin:0 auto;padding:10px;">
  <div class="f18 text-center mv-2 bold">合伙人服务日报</div>
  <div class="f14 text-center mb-3">2017年8月28日</div>

  <div class="">
    <div class="f14 mb bold">一、旗舰基金股东动态</div>
    <div class="f14 mb">1、旗舰基金公司新闻</div>
    <table class="table-separate">
      <tbody>
      <tr>
        <td class="tit" valign="middle">刚泰</td>
		
        <td class="cont">
          <p class="bold">&nbps;第 3 期员工持股计划(草案)摘要</p>
          <p>1、甘肃刚泰控股(集团)股份有限公司(以下简称“公司”)第3期员工持 股计划(以下简称“第3期员工持股计划”)根据《中华人民共和国公司法》、《中华人民共和国证券法》、
		  《关于上市公司实施员工持股计划试点的指导意见》 及其他有关法律、法规、规范性文件以及《甘肃刚泰控股(集团)股份有限公司章程》的规定制定,遵循公平、公正、公开的原则,旨在完善公司的激励机制,确保公司未来发展战略和经营目标的实现。</p>
          <p>4、第3期员工持股计划以“份”作为认购单位,每份份额为1元,起始认购 份数为100万份,超过100万份的,以10万份的整数倍累积计算。公司全部员工 持股计划涉及的股票数量累计不超过公司现有股本总额的10%,任一持有人持有的 员工持股计划份额所对应的标的股票数量不超过公司股本总额的 1%(不包括员工 在公司首次公开发行股票上市前获得的股份、通过二级市场自行购买的股份及通过股权激励获得的股份)。</p>
        </td>
      </tr>
      </tbody>
    </table>


    <div class="f14 mt-3 mb bold">一、客户沟通和反馈</div>
    <div class="f14 mb">今天联系的客户:</div>
    <div class="">
      <table class="table-separate">
        <thead>
        <th>联系人</th>
        <th>沟通内容</th>
        <th>客户反馈</th>
        </thead>
        <tbody>
        <tr>
          <td>XXX</td>
          <td>XXX</td>
          <td>XXX</td>
        </tr>
        <tr>
          <td>XXX</td>
          <td>XXX</td>
          <td>XXX</td>
        </tr>
        </tbody>
      </table>
    </div>


    <div class="f14 mt-3 mb bold">三、官网、微信和客户服务系统变化</div>
    <div class="">
      <table class="table-separate">
        <tbody>
        <tr>
          <td class="tit" valign="middle">运营</td>
          <td class="">
            <p class="bold">XXX</p>
          </td>
          <td class="text-left pl-2">
            <p>· 上海正心公益基金会正式获批 1727 </p>
            <p>· XXXX</p>
          </td>
        </tr>
      
        </tbody>
      </table>
    </div>

    <div class="f14 mt-3 mb bold">四、其他工作</div>
    <div class="f14 mb">近期过生日的客户有: </div>
    <div class="">
      <p>8.27 王军</p>
      <p class="bold">8.27 陈鱼海</p>
    </div>
  </div>
</div>

</body>
</html>

这里记录了 博主的踩过的一些坑 希望其他人不要踩坑:

这里使用的是 freemark 生成html 然后由HTML 转PDF(下次分享一下freemark技术) 。

前面博主找到一个 wxhtmltopdf 这个软件去转PDF 非常简单。但是centos 系统装不上去。客户也不让装软件所以放弃了。。(后面更新一下这个软件的使用以及一些坑)

博主深知 遇到问题的时候 能够与你交流的很少 这里提供QQ群:600922504

欢迎大家一起交流学习!!

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档