首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用apache poi从具有多张图纸的xlsx文件中提取基于给定图纸名称的文本

使用 Apache POI 从具有多张图纸的 XLSX 文件中提取基于给定图纸名称的文本,可以通过以下步骤实现:

  1. 导入 Apache POI 依赖库:在项目中引入 Apache POI 的相关依赖库,以便能够使用其提供的 API 进行操作。
  2. 加载 XLSX 文件:使用 Apache POI 的 Workbook 类加载 XLSX 文件,可以通过 FileInputStream 或者其他方式获取文件输入流,然后使用 WorkbookFactory.create 方法创建 Workbook 对象。
  3. 遍历图纸页:使用 Workbook 对象的 getNumberOfSheets 方法获取图纸页的数量,然后使用 for 循环遍历每个图纸页。
  4. 获取图纸名称:使用 Sheet 对象的 getSheetName 方法获取当前图纸页的名称,并与给定的图纸名称进行比较。
  5. 提取文本内容:如果当前图纸页的名称与给定的图纸名称匹配,可以使用 Sheet 对象的 getRow 和 getCell 方法遍历每一行和每一列,获取单元格的文本内容。
  6. 处理提取的文本内容:根据需求对提取的文本内容进行处理,例如保存到数据库、写入文件等。

以下是一个示例代码,演示如何使用 Apache POI 提取基于给定图纸名称的文本:

代码语言:txt
复制
import org.apache.poi.ss.usermodel.*;

import java.io.FileInputStream;
import java.io.IOException;

public class XLSXExtractor {
    public static void main(String[] args) {
        String filePath = "path/to/your/file.xlsx";
        String targetSheetName = "TargetSheet";

        try (FileInputStream fis = new FileInputStream(filePath);
             Workbook workbook = WorkbookFactory.create(fis)) {

            int numberOfSheets = workbook.getNumberOfSheets();

            for (int i = 0; i < numberOfSheets; i++) {
                Sheet sheet = workbook.getSheetAt(i);
                String sheetName = sheet.getSheetName();

                if (sheetName.equals(targetSheetName)) {
                    for (Row row : sheet) {
                        for (Cell cell : row) {
                            if (cell.getCellType() == CellType.STRING) {
                                String text = cell.getStringCellValue();
                                System.out.println(text);
                                // 处理提取的文本内容,例如保存到数据库、写入文件等
                            }
                        }
                    }
                    break;
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

在上述示例代码中,需要将 "path/to/your/file.xlsx" 替换为实际的文件路径,将 "TargetSheet" 替换为要提取文本的图纸页名称。可以根据实际需求对提取的文本内容进行处理。

腾讯云相关产品和产品介绍链接地址:

  • Apache POI 官方网站:https://poi.apache.org/
  • 腾讯云对象存储 COS:https://cloud.tencent.com/product/cos
  • 腾讯云云服务器 CVM:https://cloud.tencent.com/product/cvm
  • 腾讯云云数据库 MySQL:https://cloud.tencent.com/product/cdb_mysql
  • 腾讯云人工智能 AI:https://cloud.tencent.com/product/ai
  • 腾讯云物联网平台 IoT Hub:https://cloud.tencent.com/product/iothub
  • 腾讯云移动开发平台 MSDK:https://cloud.tencent.com/product/msdk
  • 腾讯云分布式文件存储 CFS:https://cloud.tencent.com/product/cfs
  • 腾讯云区块链服务 TBC:https://cloud.tencent.com/product/tbc
  • 腾讯云元宇宙服务 TUS:https://cloud.tencent.com/product/tus

请注意,以上链接仅供参考,具体选择适合的产品需要根据实际需求和情况进行评估。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

免费开源工程师项目管理系统

采用最新froala富文本编辑器,支持word图文直接粘贴发布,word图片自动上传,发布文章轻松快捷,文章支持视频和文件附件。...;文章采用富文本编辑器,支持图文word直接黏贴;成果数据采用后端分页,百万级成果数据快速显示; 成果间关联:比如先出施工图,然后一段时间后再出了对这个图纸修改通知单,那么修改单关联上这个图纸后,...; 根据资料编号规则,批量上传附件时,自动截取编号和名称,并归入对应目录; 3种权限方式:IP地址段权限,适用于局域网内相互之间无障碍访问;注册用户权限适用于远程访问;用户组(角色)权限适用于项目团队协作...√图纸易得,能更好地控制工程质量——pdf设计文件参建单位都可以阅读,提高效率,减少障碍。 √基于“用户——角色——权限”权限设置。独创根据文件扩展名来进行权限管理。...,施工方文件,政府监督文件…… 内部管理角度分,有三标一体化文件,人事文件,报销资料,合同文件…… 所以,资料管理是第一位

2.6K30

【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

DOCXMicrosoft Word开放XML文档格式,Word 2007开始使用,比DOC更加高效和具有兼容性,支持文档结构化和数据重新利用。...对于DOC格式,POI提供了HWPF子项目,使得Java应用能够DOC文件提取文本、表格和列表等内容。...它提供了广泛功能,包括DOCX文件提取文本、转换文档格式等。第六章 XLSX解析6.1 结构XLSX是Microsoft Excel默认文件格式,自2007版本起采用。...以下是一些广泛使用库:6.3.1 Apache POIApache POI:一个强大Java库,提供了广泛Microsoft Office文件格式支持,包括XLSX。...Office 2007开始,PowerPoint使用基于XML文件格式(PPTX),该格式将文档内容、媒体文件、样式等存储在一个ZIP压缩包文件内部采用一种结构化方式组织数据。

24510

JAVAPOI操作Excel

1.1Excel简介 一个excel文件就是一个工作簿workbook,一个工作簿可以创建多张工作表sheet,而一个工作表包含多个单元格Cell,这些单元格都是由列(Column)行(Row)组成...行则使用数字表示,例如;A3 表示第三行第一列,E5表示第五行第五列。 ? 1.2 POI工具包 JAVA操作Excel有两种比较主流工具包: JXL 和 POI 。...官网:http://poi.apache.org ,POI支持office所有版本,所以选择POI来讲解。...文件后缀为.xlsx 查看POI api文档,我们可以查询POI中所有这些对象属性和方法。...如;在处理03和07版本excel文件时利用统一接口就可以做到分析两个版本excel数据。 POI同时读入03和07版本excel。 方法一:判断文件名称后调用对应版本读入方法。

1.2K20

Apache POI与easyExcel:Excel文件导入导出技术深度分析

在导入Excel文件时,Apache POI会将整个文件加载到内存,然后提供API来访问和操作文件各个元素,如单元格、行、列等。...1.1 POI实现读取excel 下面是一演示如何使用 Apache POI 导入(读取)和导出(写入)Excel 文件(.xlsx 格式) org.apache.poi...1.2 poi实现写入excel 当使用Apache POI写入.xlsx格式Excel文件时,您需要创建一个XSSFWorkbook对象来表示整个工作簿,然后在其中创建XSSFSheet对象来表示工作表...EasyExcel 是在在POI解析引擎基础上改进,但并没有完全重写 Apache POI 整个解析引擎,特别是对于 XLSX 文件格式(即 Excel 2007 及以上版本所使用格式,POI...对应是 XSSF 实现),它仍然是基于 POI 一些底层结构和功能。

62610

AutoCAD 2023 for Mac(cad2023)

6、修订云为图形最新更改绘制修订云,从而快速识别更新内容 7、视图按名称保存视图,轻松返回到特定视图以便快速参考或应用到布局视口 8、布局指定图纸大小、添加标题栏、显示模型多个视图 9、字段使用文本对象字段来显示字段值更改时可自动更新文本...10、数据链接通过在 Microsoft Excel 电子表格和图形表格之间创建实时链接来启用同步更新 11、数据提取对象中提取信息、块和属性,包括图形信息 12、动态块添加灵活性和智能到块参照...,包括基本视图、投影视图、截面视图和局部视图 图片 四、协作 1、PDF 文件通过导入、导出或附加为参考底图,来共享和重复使用 PDF 文件数据 2、DGN 文件通过导入、导出或附加为参考底图,来共享和重复使用...DGN 文件数 3、dwG 参照将 dwG 文件附加到当前图形作为外部参照文件 4、图像参照将图像文件附加到当前图形作为外部参照文件 5、图纸集查看、访问、管理和绘制多个图形作为图纸集 6、参照和导入模型将...Navisworks 模型作为参考底图附加到图形,然后其他应用程序导入模型 7、地理位置和联机地图将地理位置信息插入到图形,并从联机地图服务显示图形地图 五、安装和自定义 1、TrusteddwG

4.8K50

安装读取Excel

readxl支持传统.xls格式和基于XML现代.xlsx格式。所述libxls C库是用来支持.xls,其提取出大量底层二进制格式复杂性。...为了解析.xlsx,我们使用RapidXML C ++库。 安装 CRAN安装最新发行版本最简单方法是安装整个tidyverse。...使用readxl_example()不带参数帮助程序将其列出,或使用示例文件名进行调用以获取路径。...默认情况下,列名和类型由工作表数据确定。用户还可以通过col_names和提供col_types名称,并通过来控制名称修复.name_repair。...这是一种基于libxlsxwriter将数据帧导出到xlsx可移植且轻量级方法。它比openxlsx简约得多,但是在简单示例上,它速度似乎快两倍,并且可以写入较小文件

2K41

网页编辑DWG框架搭建快速入门(WEB CAD SDK)

2.MxCAD:是基于mxdraw开发在线CAD开发包,详细参考文档:ps://mxcadx.gitee.io/mxcad_docs/zh/。...建议使用最新版本chrome浏览器或edge浏览器。...支持AutoCAD R14 到AutoCAD 2024所有dwg图纸格式,未来也将支持新出现AutoCAD文件格式。...2.解压 下载好 MxDraw 云图开发包压缩包后使用解压软件解压(建议解压位置路径使用英文,路径不要太长),由于开发包内容很多,解压需要时间,请耐心等待!...MxCAD文件上传保存服务程序:CAD图纸编辑后,保存到服务器服务 2)效果演示 点击“启动浏览器查看演示”,展示前端在线预览CAD图纸 选择本地DWG文件 打开DWG文件,在线预览 点击“VueBrowse

6300

建立数据驱动,关键字驱动和混合Selenium框架这些你了解吗

Apache POI与Selenium WebDriver一起使用 WebDriver不直接支持读取excel文件。...因此,我们使用Apache POI 读取/写入任何Microsoft Office文档。您可以从此处下载Apache POI(JAR文件集)。...我进一步定义了一个for循环,以excel工作簿检索文本。 但是,为了给定工作表编号,列编号和行编号读取数据,将对“ ReadExcelFile”类进行调用。...现在,基于excel文件中方法名称存在,将从另一个类调用这些方法。同样,为了读取excel文件并发送回结果,我编写了另一个Class。它们都显示在下面。 调用方法文件就是这个。...在下面的代码片段查看修改后“ DriverScript”类。 在这里,不是使用多个If / Else循环,而是使用数据驱动方法excel文件读取方法名称

94520

浅谈Tekla二次开发学习历程

Tekla,而对业主结算和分包结算时可能更具有说服力些。...TEKLA输出钢筋数据文件流来进行智能化机器加工,但是这些本人还未经过实践,只是钢筋工程量这块儿精细之处猜想二次开发角度,只需要后续开发出对应插件,那将来在效率以及功能上还是非常卓越。...在Tekla二次开发过程,本人最初学习阶段使用是Tekla2019,但是后续在开发过程为适应广大工程师需求,试验过其实对于版本没有过大要求,可以在2019版本开发完成,后续为其他版本使用只需要修改引用命名空间即可...第二种就是自己做开发插件来提取数据到Datagridview,Excel,PDF,Word这种,纯粹就是模型数据,而这个最需要就是看懂开发文档,钢结构这部分一些数据完全可以代码逆推出来,但是对于主钢而言...(我指的是那种一块型钢需要好几块板来拼接)可以建模时候就用板来拼接,但是工程量有些大,可以直接用型钢截面去做,在提取数据到报表时候分开获取腹板、翼缘板就可以达到同样效果,钢筋的话纯粹就是为难人,提取数据累要死

1.5K10

Java数据可视化:报表技术

Excel报表开发一般分为两种形式: 1、为了方便操作,基于Excel报表批量上传数据,也就是把Excel数据导入到系统。 2、通过java代码生成Excel报表。...= workbook.createSheet(工作表名称, 工作表索引值); 3、创建单元格 添加文本类单元格 Label labelC = new Label(列索引值, 行索引值, "单元格内容...4.1、POI操作Excel高低版本区别 在POI包中有如下几个主要对象和excel几个对象对应: | 对应excel名称 | 低版本类名 | 高版本类名 | | :------------...4.2、实现用户数据导入 4.2.1、需求 把资料中《用户导入测试数据.xlsx》文档数据导入到系统, 内容如下: 数据导入就是读取excel内容,转成对象插入到数据库 4.2.2 、...最终目标就是读取每一行数据,把数据转成用户对象,保存到表 实现步骤:1、根据上传文件创建Workbook ​ 2、获取到第一个sheet工作表 ​ 3、第二行开始读取数据 ​ 4、读取每一个单元格

2.6K40

报表技术

Excel报表开发一般分为两种形式: 1、为了方便操作,基于Excel报表批量上传数据,也就是把Excel数据导入到系统。 2、通过java代码生成Excel报表。...= workbook.createSheet(工作表名称, 工作表索引值); 3、创建单元格 添加文本类单元格 Label labelC = new Label(列索引值, 行索引值, "单元格内容...4.1、POI操作Excel高低版本区别 在POI包中有如下几个主要对象和excel几个对象对应: | 对应excel名称 | 低版本类名 | 高版本类名 | | :------------...4.2、实现用户数据导入 4.2.1、需求 把资料中《用户导入测试数据.xlsx》文档数据导入到系统, 内容如下: 数据导入就是读取excel内容,转成对象插入到数据库 4.2.2 、...最终目标就是读取每一行数据,把数据转成用户对象,保存到表 实现步骤:1、根据上传文件创建Workbook ​ 2、获取到第一个sheet工作表 ​ 3、第二行开始读取数据 ​ 4、读取每一个单元格

2.5K30

大厂技术实现 | 图像检索及其在高德应用 @计算机视觉系列

图像检索任务指的是,给定查询图像,图像数据库中找到包含相同或相似实例图像。本文研究是高德地图POI信息更新,即根据自有图像源,将每个新增或调整POI及时制作成数据。...POI 数据包含名称信息、位置信息等,能满足用户基本需求——使用电子地图“查找目的地”,进而唤起导航服务。...图片3)文本依赖性POI 牌匾还有一个独有特性就是对文本强依赖,主要是对 POI 名称文本依赖。在该场景下,希望两个牌匾不要匹配。这就需要引入文本特征来增强特征区分性。...『视觉分支』输入是 POI 牌匾图像信息,使用双分支进行特征提取;『文本分支』输入是 POI 牌匾文本信息,使用BERT进行特征提取。...图片4.1 全局特征通常对于检索任务来说,使用深度学习模型提取全局特征具有更高鲁棒性,可以适应牌匾视角、颜色、光照变化等不同场景。

1.1K22

每日一博 - Excel导入导出那点事儿

POI 想到数据导入导出,大部分人最会想到apachepoi框架 以及Excel版本问题。...提供对 PowerPoint 演示文稿读写支持,可以读取和修改 PPT 文本、表格、图片等内容。 提供对 Outlook 电子邮件支持,可以创建和修改 Outlook 邮件文件。...POI3.8之后版本才有的,它可以操作Excel2007以后所有版本Excel,扩展名是.xlsx ---- 不同API实现优缺点 HSSFWorkbook 它是POI版本中最常用方式 缺点...因为所创建book,Sheet,row,cell等在写入到Excel之前,都是存放在内存 ---- SXSSFWorkbook POI 3.8版本开始,提供了一种基于XSSF低内存占用SXSSF...方式: 优点: 一般不会出现内存溢出(它使用了硬盘来换取内存空间,当内存数据达到一定程度这些数据会被持久化到硬盘存储起来,而内存都是最新数据), 支持大型Excel文件创建(存储百万条数据轻轻松松

18730

AI文档智能助理都是如何处理pdf

、tabula(可用于表格提取)、pdfplumber等组件,对于图片型,我们可以先获取文件里面的图片,然后使用ppstructure进行图片处理。...但是pdf2txt.pyPDF文件提取所有文本内容。但不能识别画成图片文本,这需要对图片特征进行识别。对于加密PDF你需要提供一个密码才能解析,对于没有提取权限PDF文档你得不到任何文本。...Apache PDFBox Apache PDFBox库是用于处理PDF文档开源Java工具。该项目允许创建新PDF文档,操纵现有文档以及文档中提取内容功能。...和Excel xlsx文件。...docx、pptx和xlsx是Microsoft Office套件文件格式,用于分别存储Word文档、Powerpoint演示文稿和Excel电子表格。

75820

Altium_Designer使用

​内容包括原理图、PCB图绘制方法,封装制作以及DRC规则使用图纸打印、出错处理,3D元件体建立教程及相应3D封装下载等。持续更新,原创不易!...对于由多张原理图组成电路使用“Navigation”在整个项目中搜索,需要做如下设置。 Shift+C即可取消选中。...此时就可以将Protel99SE文件元件复制到AD9。 其中文件仍然以.SCH与.PCB为尾椎,将.SCH内容复制到.SchDoc,将.PCB内容复制、特殊粘贴到PcbDoc。...本项目完整内容移步:基于MC14013电动操作控制模块(本人自主设计),可用于学习以及作为项目参考使用。 4、查找3D元件体技巧 在淘宝中找到元件英文名称,再搜索。...七、原理图与PCB技巧汇总 1、原理图中直观封装大小 十、问题汇总 1、Add Standalone License file无反应 复制***.alf与patch.exe文件至安装目录,再运行patch.exe

85431

PDF格式转换CAD,DOCX、PPTX、XLSX、HTML

PDF至CAD DWG格式转换:对于设计师和工程师来说,这项服务能够将PDF设计图纸无缝地转变成可在各种CAD软件编辑和修改DWG格式,为进一步设计工作奠定了基础。2....3.PDF至PPTX格式转换:当您需要将PDF格式文件转换为可在演示中使用PPTX幻灯片时,我们服务可以确保转换后文件保留了原PDF格式和风格。4....PDF至XLSX格式转换:对于财务分析师和会计专业人士,将PDF表格和数据转换成ExcelXLSX格式至关重要,它支持进一步数据分析和编辑。5....PDF至HTML格式转换:当内容需要在网页上发布或整合到网站时,将PDF文档转换成HTML格式是一种普遍需求。我们服务确保了PDF到网页内容流畅转换,使得内容能够在互联网上被广泛分享和阅读。...我们致力于提供高效且精确转换服务,以确保最终文件质量满足您专业标准,无论是图形精确对齐,还是文本准确表述,我们都力求做到最好。

11320

7 行代码优雅地实现 Excel 文件导出功能?

除了上面说Apache poi、jxl 都存在生成 excel 文件不够简单优雅快速外,它们都还存在一个严重问题,那就是非常耗内存,严重时会导致内存溢出。...POI 虽然目前来说,是 excel 解析框架中被使用最广泛,但这个框架并不完美。 为什么这么说呢? 开发者们大部分使用 POI,都是使用其 userModel 模式。...以下是官方介绍: 四、EasyExcel 解决了什么 主要来说,有以下几点: 传统 Excel 框架,如 Apache poi、jxl 都存在内存溢出问题; 传统 excel 开源框架使用复杂、繁琐;...表头 head,以及每个单元格内数据顺序都没指定,能达到想要效果么?别急,后面会讨论这块! ②:创建需要写入数据集,当然了,正常业务,这块都是数据库查询出来。...Excel 2007 1048576 16384 csv 由于是文本文件,实际上没有最大行数限制,但是用 Excel 客户端打开还是多了不显示。

2.3K31
领券