首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Apache Poi:获取DOC文档中的页数

Apache POI是一个用于操作Microsoft Office格式文件(如Word、Excel和PowerPoint)的Java库。它提供了一组API,可以读取、写入和修改这些文件。

对于获取DOC文档中的页数,可以使用Apache POI的XWPFDocument类来实现。以下是一个示例代码:

代码语言:txt
复制
import org.apache.poi.xwpf.usermodel.XWPFDocument;

import java.io.FileInputStream;
import java.io.IOException;

public class GetDocPageCount {
    public static void main(String[] args) {
        try {
            // 加载DOC文档
            FileInputStream fis = new FileInputStream("path/to/your/doc/file.doc");
            XWPFDocument document = new XWPFDocument(fis);

            // 获取页数
            int pageCount = document.getProperties().getExtendedProperties().getUnderlyingProperties().getPages();

            System.out.println("页数:" + pageCount);

            // 关闭文档
            document.close();
            fis.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

上述代码中,首先使用FileInputStream加载DOC文档,然后创建XWPFDocument对象表示该文档。通过调用XWPFDocument的getProperties()方法获取文档的属性,再调用getExtendedProperties()方法获取扩展属性,最后调用getPages()方法获取页数。

Apache POI的优势在于它是一个开源的Java库,提供了丰富的API来处理Microsoft Office格式文件。它可以方便地读取、写入和修改这些文件,使开发人员能够轻松地操作和处理DOC文档。

Apache POI的应用场景包括但不限于:

  • 读取和解析DOC文档中的内容,如提取文本、表格、图片等。
  • 创建和生成DOC文档,如生成报告、合同等。
  • 修改和更新DOC文档,如替换文本、插入表格等。

腾讯云提供了一系列与Apache POI相关的产品和服务,例如对象存储(COS)用于存储和管理DOC文档,云函数(SCF)用于执行文档处理任务,云开发(TCB)用于构建基于Apache POI的应用等。您可以访问腾讯云官网了解更多相关产品和服务的详细信息。

参考链接:

  • Apache POI官方网站:https://poi.apache.org/
  • 腾讯云对象存储(COS)产品介绍:https://cloud.tencent.com/product/cos
  • 腾讯云云函数(SCF)产品介绍:https://cloud.tencent.com/product/scf
  • 腾讯云云开发(TCB)产品介绍:https://cloud.tencent.com/product/tcb
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Android 使用 ApachePOI 组件读写 Word doc 和 docx 文件

最近在项目中要生成Worddoc和docx文件,一番百度google之后,发现通过java语言实现主流是ApachePOI组件。...除了POI,这里还有另一种实现,不过我没有去研究,有兴趣同学可以研究研究。 关于POI可以访问Apache POI官网获取详细信息。 进入主题!...有兴趣同学可以研究研究。 二、实现doc文件读写 Apache POIHWPF模块是专门用来读取和生成doc格式文件。...在HWPF,我们使用HWPFDocument来表示一个word doc文档。在看代码之前,有必要了解HWPFDocument几个概念: ?...读写前注意:Apache POI 提供HWPFDocument类只能读写规范.doc文件,也就是说假如你使用修改 后缀名 方式生成doc文件或者直接以命名方式创建,将会出现错误“Your file

4.2K100

Apache POI详解及Word文档读取示例

根据官网描述,poi是微软文档系列Java API。这里微软文档(Microsoft Documents),就是指word、excel(xls 和 xlsx)、PowerPoint 等。...不同地方是,4.1.0 poi-ooxml-schemas-${version}.jar,在5.2.0变成了poi-ooxml-full-${version}.jar和poi-ooxml-lite...三 读取word内容 在本文开始挂系列文章链接,已经包含了word文档创建、生成表格等相关操作,接下来我们要尝试读取word文档内容,最好包含格式,这样可以配合前端实现word在线编辑效果...; import org.apache.poi.hwpf.usermodel.Range; import java.io.*; /** * 注:HWPFDocument对应 word.doc,不支持...(); } } 在printWord()方法,我们打印了文档每个段落以及该段落格式,以本地测试时使用文档为例,输出如下: 0,0,正文 1,0,正文 2,1,标题 1 3,2,

6.2K31

Apache POI详解及Word文档读取示例

根据官网描述,poi是微软文档系列Java API。这里微软文档(Microsoft Documents),就是指word、excel(xls 和 xlsx)、PowerPoint 等。...不同地方是,4.1.0 poi-ooxml-schemas-${version}.jar,在5.2.0变成了poi-ooxml-full-${version}.jar和poi-ooxml-lite...三 读取word内容 在本文开始挂系列文章链接,已经包含了word文档创建、生成表格等相关操作,接下来我们要尝试读取word文档内容,最好包含格式,这样可以配合前端实现word在线编辑效果,方便在...; import org.apache.poi.hwpf.usermodel.Range; import java.io.*; /** * 注:HWPFDocument对应 word.doc,不支持...(); } } 在printWord()方法,我们打印了文档每个段落以及该段落格式,以本地测试时使用文档为例,输出如下: 0,0,正文 1,0,正文 2,1,标题 1 3,2,标题

2.7K40

Java 操作 Office:POI word 之文档信息提取

操作 Office:POI word 之表格格式 Apache POI详解及Word文档读取示例 楔子 工作忙碌,又是好久不见。...二 基于apache poi内容提取 关于apache poi,基础信息介绍、jar包依赖引入方式已经在之前系列文章:Apache POI详解及Word文档读取示例 做了介绍,所以这里不再赘述。...我们可以使用poi提供api来读取worddoc 和 docx格式文档,并能够获取到每个段落格式(style),判断是目录,正文,还是标题等。...文档内容解析 重点:1、文档读取方式:HWPFDocument;2、格式获取:通过Range获取所有段落数量,并逐个遍历,再通过文档StyleSheet,获取格式名;3、根据业务需要,对格式做一些基础转换...文档表格提取 /** * 读取doc格式文档表格 * @param in * @throws Exception */ public List

3.2K20

Android使用模板生成支持手机直接查看Word文档

最近在项目工作,碰到一个很棘手需求,说是要在手机端根据模板生成word文档,而且不借助第三方软件可以查看word文档,一开始听这个需求差不多蒙了,这要怎么做,为什么不把生成word文档这个工作放在后台呢...Apache 公司推出 Apache POI,我们来看下他介绍:Apache POI 是用Java编写免费开源跨平台 Java API,Apache POI提供API给Java程式对Microsoft...废话少说开始编码,首先我们要下Apache POI开发jar包,下载地址,这里推荐不要下最新版本,因为一开始我用最新版本会出一下莫名其妙问题,后面换旧版本就OK了。...,首先我们要注意是我们使用poiapi大部分是在org.apache.poi.hwpf下面的,大家不要导错包了,因为apache每个包对应内容不同: ?...其实看起来比较复杂功能只要我们静下心来想想就没有我们想象那么复杂,今天就为大家分享到这了。

1.4K20

html可以转换成word_html显示word文档

目前从html转换word为doc格式,而图片处理支持是docx格式,所以需要手动把doc另存为docx,然后才可以进行图片替换。...一.添加maven依赖 主要使用了以下和poi相关依赖,为了便于获取html图片元素,还使用了jsoup: org.apache.poi</groupId...: 三.html转换为word 实现思路就是先把html所有图片元素提取出来,统一替换为变量字符”${imgReplace}“,如果多张图片,可以依序排列下去,之后生成对应doc文件(之前试过直接生成...,多张图片就会报错,是因为添加了图片,processParagraphs方法runs大小改变了,会报ArrayList异常,就和我们循环list删除元素会报异常道理一样,解决方法就是复制一个新...org.apache.poi.xwpf.usermodel.XWPFParagraph;import org.apache.poi.xwpf.usermodel.XWPFRun;import org.apache.poi.xwpf.usermodel.XWPFTable

7.9K30

用JAVA写word模板自动生成引擎

当然是写各种文档啦,尤其是在大公司做项目,各种规范文档不可少,虽然说一个成熟项目管理过程的确是要依靠各种文档来明确项目里程碑及具体设计确认和需求分工,但是TJ君还是更喜欢把时间花在开发代码上。...这款引擎基于Apache Poi,可以根据用户输入内容直接生成相应word文档,很是方便。...Apache Poi是用Java编写一款免费开源跨平台JavaAPI,该API可以通过Java程序对Office格式文档进行读写操作,可以说是现阶段Java库当中最好用office处理库了,可能都不用加之一两个字...所以基于Apache PoiPoi-tl可以让你在word文档任何地方做任何你想做事情。...当然,如果想将Poi-tl用好的话,还是要花一点时间来研究其中具体模块语法,好在Poi-tl提供详细示例代码讲解,小伙伴们只要用心学一下,很快就能掌握 到底能不能让小伙伴们减轻写文档压力呢

1.1K10

POI生成word文档完整案例及讲解

一,网上API讲解 其实POI生成Word文档规则就是先把获取数据转成xml格式数据,然后通过xpath解析表单式应用取值,判断等等,然后在把取到值放到word文档,最后在输出来。...获取一个Runs一个Run:XWPFRun run = xwpfRuns.get(index); 2、poi之word文档结构介绍之正文表格 一个文档包含多个表格,一个表格包含多行,一行包含多列(...格),每一格内容相当于一个完整文档 获取所有表格:List xwpfTables = doc.getTables(); 获取一个表格所有行:List<XWPFTableRow...里面可以有表格,使用xwpfTableCell.getTables()获取,and so on 在poi文档中段落和表格是完全分开,如果在两个段落中有一个表格,在poi是没办法确定表格在段落中间。...之word文档结构介绍之页脚: 页脚和页眉基本类似,可以获取表示页数角标 1.2,参考二 POI操作Word简介 POI读写Excel功能强大、操作简单。

11K40

POI生成word文档完整案例及讲解

一,网上API讲解 其实POI生成Word文档规则就是先把获取数据转成xml格式数据,然后通过xpath解析表单式应用取值,判断等等,然后在把取到值放到word文档,最后在输出来。...获取一个Runs一个Run:XWPFRun run = xwpfRuns.get(index); 2、poi之word文档结构介绍之正文表格 一个文档包含多个表格,一个表格包含多行,一行包含多列(...格),每一格内容相当于一个完整文档 获取所有表格:List xwpfTables = doc.getTables(); 获取一个表格所有行:List<XWPFTableRow...里面可以有表格,使用xwpfTableCell.getTables()获取,and so on 在poi文档中段落和表格是完全分开,如果在两个段落中有一个表格,在poi是没办法确定表格在段落中间。...之word文档结构介绍之页脚: 页脚和页眉基本类似,可以获取表示页数角标 1.2,参考二 POI操作Word简介 POI读写Excel功能强大、操作简单。

4.3K31

POI操作Excel入门案例(Spring boot)

一、简介 Apache POIApache软件基金会免费开源跨平台 Java API,POI提供API给Java程序对Microsoft Office格式(Excel、WORD、PowerPoint...NET开发人员则可以利用NPOI (POI for .NET) 来存取 Microsoft Office文档功能。...HWPF:提供读写Microsoft Word DOC97格式档案功能。 XWPF:提供读写Microsoft Word DOC2003格式档案功能。...:导入EXCEL表格 从本地导入EXCEL表格内容,并将结果封装到List集合,为了方便阅读,这里把异常都抛出,实际情况下,应该对异常进行捕获,并进行处理; import org.apache.poi.hssf.usermodel.HSSFRow...; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFWorkbook;

38510

Java中用Apache POI生成excel和word文档

概述: 最近在做项目的过程遇到了excel数据导出和word图文表报告导出功能,最后决定用Apache POI来完成该项功能。...本文就项目实现过程一些思路与代码与大家共享,同时,也作为自己一个总结,以备后用。 功能: 1、从数据库查询数据导出为excel; 2、导出word包括,内容有文字,图片,表格等。 效果: ?...; import org.apache.poi.hssf.usermodel.HSSFCellStyle; import org.apache.poi.hssf.usermodel.HSSFFont...sheet,对应Excel文件sheet HSSFSheet sheet = wb.createSheet("学生表一"); // 第三步,在sheet添加表头第...文档位置,此例为应用根目录 XWPFDocument doc=new ExportWordTest().replaceDoc("D:\\word_temp.docx", map);

3K40
领券