如何使用Apache POI提供的事件API获取excel工作表的合并区域(合并单元格)?
使用“传统的”类似DOM的解析风格,有称为Sheet.getNumMergedRegions()
和Sheet.getMergedRegion(int)
的方法。不幸的是,我需要处理巨大的Excel文件,在这些文件中,即使是允许我使用的最高Xmx值(在这个项目中)也会出现内存不足错误。所以我想使用事件API,但不能找到如何获得合并区域的信息,我需要知道这些信息才能正确地“理解”内容……
使用这里给出的示例:http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api,我将获得合并区域中每个单元格的事件(不过,只有第一个单元格包含任何文本内容)。因此,如果没有更直接的方法,了解如何(安全地)将这些合并的单元格与其他(空)单元格区分开来可能会有所帮助……
发布于 2012-07-23 19:59:52
我不确定合并的单元格信息存储在哪里,但我相当确定它不会与单元格数据本身一起存储,因为这不是Excel的方式。
我建议你做的是创建一个没有合并单元格的简单文件。然后,复制一份,并添加一个合并的单元格。解压缩这两个文件(.xlsx是xml文件的压缩文件),并对它们进行比较。这将非常快速地向您显示设置为将单元格标记为合并的内容。(我的直觉是它将在工作表设置中的某个位置,靠近起始位置,但不接近单元格值,BICBW)
一旦知道了合并单元格的详细信息,就可以查看用于处理合并单元格的XSSF UserModel代码,以了解合并单元格的工作方式、操作方式、选项等。记住这一点,您可以查看文件格式文档以了解完整的详细信息,但首先查看这些文档可能会有些繁琐和详细。最后,你可以添加你的代码来使用合并的信息细节,一旦你知道从哪里得到它!
发布于 2015-04-08 21:28:45
您需要打开流并对其进行两次解析。
第一次-提取合并的单元格。它们出现在<sheetData>...</sheetData>
标记之后的sheet...xml
文件中,如下例所示:
...
< /sheetData >
< mergeCells count="2" >
< mergeCell ref="A2:C2"/ >
< mergeCell ref="A3:A7"/ >
</mergeCells >
将其提取并保存在某个列表中。
然后再次打开流并像往常一样解析它,以提取行和单元格。在endElement(...)
方法中,当完成每一行时,检查该行是否(部分或全部)出现在合并区域中。
发布于 2017-03-21 04:30:44
来扩展一下Mike的答案。您可以创建一个ContentHandler
来定位合并区域,如下所示:
import java.util.ArrayList;
import java.util.List;
import org.apache.poi.ss.util.CellRangeAddress;
import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;
public class MergedRegionLocator extends DefaultHandler {
private final List<CellRangeAddress> mergedRegions = new ArrayList<>();
@Override
public void startElement (String uri, String localName, String name, Attributes attributes) {
if ("mergeCell".equals(name) && attributes.getValue("ref") != null) {
mergedRegions.add(CellRangeAddress.valueOf(attributes.getValue("ref")));
}
}
public CellRangeAddress getMergedRegion (int index) {
return mergedRegions.get(index);
}
public List<CellRangeAddress> getMergedRegions () {
return mergedRegions;
}
}
将其与POIs基于事件的解析一起使用的一个示例:
OPCPackage pkg = OPCPackage.open(new FileInputStream("test.xlsx"));
XSSFReader reader = new XSSFReader(pkg);
InputStream sheetData = reader.getSheetsData().next();
MergedRegionLocator mergedRegionLocator = new MergedRegionLocator();
XMLReader parser = XMLReaderFactory.createXMLReader();
parser.setContentHandler(mergedRegionLocator);
parser.parse(new InputSource(sheetData));
mergedRegionLocator.getMergedRegions();
https://stackoverflow.com/questions/11608605
复制相似问题