Word或Excel程序是以一种COM组件形式存在的。如果能够在Java中调用相应组件,便能使用它的方法来获取文档中的文本信息。Jacob是一个JAVA到微软的COM接口的桥梁。Jacob允许任何JVM访问COM对象,从而使JAVA应用程序能够调用COM对象。如果要对 MS Word、Excel 进行处理,Jacob 是一个好的选择。
12.1、Jacob的下载
Jacob 是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库,并通过JNI的方式实现了在Java平台上对COM程序的调用。Jacob下载的地址为:
http://sourceforge.net/project/showfiles.php?group_id=109543&package_id=118368。
12.2、在Eclipse中的配置
(1) 将jacob.jar导入工程的Build Path,然后确认自己机器的CPU类型(X86或AMD64),并选择不同目录下的jacob.dll文件。
(2) 将jacob.dll放到%JAVA_HOME%\jre\bin目录下,其中,%JAVA_HOME%就是JDK的安装目录。注意这个的jre目录必须是Eclipse当前正在使用的目录,在Eclipse中选择“window->Preferences”菜单,在弹出的对话框中选择“Java->Installed JREs”项。
(3) 当前选择的JRE是“C:\Program Files\Java\jdk1.5.0_07\jre”目录下的,所以需要把jacob.dll复制到“C:\Program Files\Java\jdk1.5.0_07\jre\bin”目录下面。
(4) 在工程中新建一个ch7.jacob包,并在包中创建WordReader类。该类将提供一个静态的extractDoc()方法。它接收两个参数,一个是要处理的DOC文件名,另一个则是输出的文件名,然后通过JNI调用Word的API转换内容,该函数的代码如下。
1 public static void extractDoc(String inputFIle, String outputFile) {
2
3 boolean flag = false;
4
5
6
7 // 打开Word应用程序
8
9 ActiveXComponent app = new ActiveXComponent("Word.Application");
10
11 try {
12
13 // 设置word不可见
14
15 app.setProperty("Visible", new Variant(false));
16
17 // 打开word文件
18
19 Dispatch doc1 = app.getProperty("Documents").toDispatch();
20
21 Dispatch doc2 = Dispatch.invoke(
22
23 doc1,
24
25 "Open",
26
27 Dispatch.Method,
28
29 new Object[] { inputFIle, new Variant(false),
30
31 new Variant(true) }, new int[1]).toDispatch();
32
33 // 作为txt格式保存到临时文件
34
35 Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[] {
36
37 outputFile, new Variant(7) }, new int[1]);
38
39 // 关闭word
40
41 Variant f = new Variant(false);
42
43 Dispatch.call(doc2, "Close", f);
44
45 flag = true;
46
47 } catch (Exception e) {
48
49 e.printStackTrace();
50
51 } finally {
52
53 app.invoke("Quit", new Variant[] {});
54
55 }
56
57 if (flag == true) {
58
59 System.out.println("Transformed Successfully");
60
61 } else {
62
63 System.out.println("Transform Failed");
64
65 }
66
67 }
注意:在使用Jacob时,很重要的一点是,用户本地系统中必须安装有Word的应用程序。否则也就无法建立Java-COM桥,进而无法解析了。
12.3、Jacob中常用方法
(1) 初始化com的线程,很重要,否则第二次创建com对象的时候会出现can't co-create object异常,完成操作com组件后要调用release方法。
ComThread.InitSTA();// 初始化com的线程
(2) 初始化word应用程序,新建一个空白文档,取得文档内容对象
//Instantiate objWord //Declare word object
ActiveXComponent objWord = new ActiveXComponent("Word.Application");
//Assign a local word object
Dispatch wordObject = (Dispatch) objWord.getObject();
//Create a Dispatch Parameter to show the document that is opened
Dispatch.put((Dispatch) wordObject, "Visible", new Variant(true));
// new Variant(true)表示word应用程序可见
Tip:设置一个对象的属性的时候,利用Dispatch的put方法,给属性赋值。上面这行语句相当于vb的wordObject.Visible=true语句。
//Instantiate the Documents Property
Dispatch documents = objWord.getProperty("Documents").toDispatch();
//documents表示word的所有文档窗口。
//Add a new word document, Current Active Document
Dispatch document = Dispatch.call(documents, "Add").toDispatch();
// 使用Add命令创建一个新文档,用Open命令可以打开一个现有文档
Tip:调用一个对象的方法的时候,利用Dispatch的call方法,上面的语句相当于vb的document = documents.Add() 语句。
Dispatch wordContent = Dispatch.get(document, "Content").toDispatch();
// 取得word文件的内容
Tip:取得一个对象的成员变量(属性)时,利用Dispatch的get方法,上面的语句相当于vb的wordContent = document.Content语句。
(3) 取得word文档的内容后,可以对其内容进行操作
Dispatch.call(wordContent, "InsertAfter", "这里是一个段落的内容");//插入一个段落
(4) 设置刚插入的段落的文字格式
Dispatch paragraphs = Dispatch.get(wordContent, "Paragraphs").toDispatch();
// 获取所有段落
int paragraphCount = Dispatch.get(paragraphs, "Count").toInt();
// 总的段落数
Dispatch lastParagraph = Dispatch.call(paragraphs, "Item",new Variant(paragraphCount)).toDispatch();
// 最后一段
Dispatch lastParagraphRange = Dispatch.get(lastParagraph, "Range").toDispatch();
Dispatch font = Dispatch.get(lastParagraphRange, "Font").toDispatch();
Dispatch.put(font, "Bold", new Variant(true));
// 设置为黑体
Dispatch.put(font, "Italic", new Variant(true));
// 设置为斜体
Dispatch.put(font, "Name", new Variant("宋体")); //
Dispatch.put(font, "Size", new Variant(12)); //小四
注意:如果想插入一个新的空白行,也需要设置段落的文字格式,否则新插入行的文字格式会于刚插入的段落的格式相同。
(5) 将当前文档保存
Dispatch.call(document, "SaveAs", new Variant("C:abc.doc")); // 保存一个新文档
(6) 释放COM线程
ComThread.Release();//释放com线程。根据Jacob的帮助文档,com的线程回收不由java的垃圾回收器处理。
12.4、Jacob中常用模块
(1) 打印模块
1 ActiveXComponent axc = null;
2 try {
3 ComThread.InitSTA();
4 axc = new ActiveXComponent("Excel.Application");
5 Dispatch.put(axc, "Visible", new Variant(false));
6 Dispatch workbooks = axc.getProperty("Workbooks").toDispatch();
7 Dispatch workbook = Dispatch.call(workbooks, "Open", fileFullPath,
8 new Integer(0), Boolean.FALSE).toDispatch();
9 Dispatch sheets = Dispatch.call(workbook, "Worksheets").toDispatch();
10 Dispatch sheet = Dispatch.call(sheets, "Item", new Integer(1))
11 .toDispatch();
12 Dispatch.call(sheet, "PrintOut", new Integer(beginPage), new Integer(endPage), new Integer(copys));
13 Dispatch.call(workbook, "Close", Variant.VT_FALSE);
14 } finally {
15 axc.invoke("Quit", new Variant[] {});
16 ComThread.Release();
17 }
(2) 纸张大小设置
1 Dispatch pageSetup = Dispatch.call(sheet, "PageSetup").toDispatch();
2 Dispatch.put(pageSetup, "PaperSize", new Integer(8));//A3是8,A4是9,A5是11等等
可通过如下方式获取纸张大小所对应的整数值
1 int ps = Dispatch.get(pageSetup, "PaperSize").toInt();
2 System.out.println("ps=" + ps);
(3)页边距设置
1 Dispatch.put(pageSetup, "LeftMargin", new Variant(left)); //左
2 Dispatch.put(pageSetup, "TopMargin", new Variant(top)); //上
3 Dispatch.put(pageSetup, "RightMargin", new Variant(right)); //右
4 Dispatch.put(pageSetup, "BottomMargin", new Variant(bottom)); //下
5 Dispatch.put(pageSetup, "HeaderMargin", new Variant(header)); //页眉
6 Dispatch.put(pageSetup, "FooterMargin", new Variant(footer)); //页脚
注: left、top、right、bottom、header和footer是double类型的数值,并且如果单位是厘米的话,需乘以28.35。
(4) 统计Excel已使用的行数
1 Dispatch userRange=Dispatch.call(sheet, "UsedRange").toDispatch();
2 Dispatch row=Dispatch.call(userRange, "Rows").toDispatch();
3 int rowCount=Dispatch.get(row,"Count").getInt();
4 System.out.println("rowCount=" + rowCount);
(5) 在指定的行号上插入一空行
1 Dispatch rowSheet = Dispatch.call(sheet, "Rows", new Variant(i)).toDispatch();//这里的i是行号,int类型
2 rowSheet.call(rowSheet, "Insert");
(6) 根据不同版本的Excel做不同的处理
1 System.out.println("version=" + axc.getProperty("Version"));
12.5、程序实例
(1)实例一:
1 package com.xfzx.test.POI.main;
2
3 import com.jacob.activeX.ActiveXComponent;
4 import com.jacob.com.ComThread;
5 import com.jacob.com.Dispatch;
6 import com.jacob.com.Variant;
7
8 public class JacobPress {
9
10 /**
11 * @param args
12 */
13 public static void main(String[] args) {
14 // TODO Auto-generated method stub
15 printWord("D:/txt.docx");
16 // printExcel("D:/提醒通知明细通用模板.xlsx");
17 }
18
19 public static void printExcel(String filePath) {
20 /**
21 * 功能:实现打印工作
22 */
23 ComThread.InitSTA();
24 ActiveXComponent xl = new ActiveXComponent("Excel.Application");
25 try {
26 // System.out.println("version=" + xl.getProperty("Version"));
27 // 不打开文档
28 Dispatch.put(xl, "Visible", new Variant(true));
29 Dispatch workbooks = xl.getProperty("Workbooks").toDispatch();
30 // 打开文档
31 Dispatch excel = Dispatch.call(workbooks, "Open", filePath)
32 .toDispatch();
33 // 开始打印
34 Dispatch.call(excel, "PrintOut");
35 xl.invoke("Quit", new Variant[] {});
36 } catch (Exception e) {
37 e.printStackTrace();
38 } finally {
39 // 始终释放资源
40 ComThread.Release();
41 }
42 }
43
44 public static void printWord(String filePath) {
45 ComThread.InitSTA();
46 ActiveXComponent wd = new ActiveXComponent("Word.Application");
47 try {
48 // 不打开文档
49 Dispatch.put(wd, "Visible", new Variant(true));
50 Dispatch document = wd.getProperty("Documents").toDispatch();
51 // 打开文档
52 Dispatch doc = Dispatch.invoke(document, "Open", Dispatch.Method,
53 new Object[] { filePath }, new int[1]).toDispatch();
54 // 开始打印
55 Dispatch.callN(doc, "PrintOut");
56 wd.invoke("Quit", new Variant[] {});
57 } catch (Exception e) {
58 e.printStackTrace();
59 } finally {
60 // 始终释放资源
61 ComThread.Release();
62 }
63 }
64
65 // 获得文件后缀名
66 public static String getPostfix(String inputFilePath) {
67 String[] p = inputFilePath.split("\\.");
68 if (p.length > 0) {// 判断文件有无扩展名
69 // 比较文件扩展名
70 return p[p.length - 1];
71 } else {
72 return null;
73 }
74 }
75
76 }
(2)实例二:
1 public static boolean printOfficeFile(File f) {
2 if (f != null && f.exists()) {
3 String fileNameString = f.getName();
4 String postfixString = Utils.getPostfix(fileNameString);
5 if (postfixString.equalsIgnoreCase("xls")
6 || postfixString.equalsIgnoreCase("xlsx")) {
7 /**
8 * 功能:实现excel打印工作
9 */
10 ComThread.InitSTA();
11 ActiveXComponent xl = new ActiveXComponent("Excel.Application");
12 try {
13 // System.out.println("version=" +
14 // xl.getProperty("Version"));
15 // 不打开文档
16 Dispatch.put(xl, "Visible", new Variant(false));
17 Dispatch workbooks = xl.getProperty("Workbooks")
18 .toDispatch();
19 // 打开文档
20 Dispatch excel = Dispatch.call(workbooks, "Open",
21 f.getAbsolutePath()).toDispatch();
22 // 横向打印(2013/05/24)
23 // Dispatch currentSheet = Dispatch.get(excel, "ActiveSheet")
24 // .toDispatch();
25 // Dispatch pageSetup = Dispatch
26 // .get(currentSheet, "PageSetup").toDispatch();
27 // Dispatch.put(pageSetup, "Orientation", new Variant(2));
28 //每张表都横向打印2013-10-31
29 Dispatch sheets = Dispatch.get((Dispatch) excel, "Sheets")
30 .toDispatch();
31 // 获得几个sheet
32 int count = Dispatch.get(sheets, "Count").getInt();
33 // System.out.println(count);
34 for (int j = 1; j <=count; j++) {
35 Dispatch sheet = Dispatch.invoke(sheets, "Item",
36 Dispatch.Get, new Object[] { new Integer(j) },
37 new int[1]).toDispatch();
38 Dispatch pageSetup = Dispatch.get(sheet, "PageSetup").toDispatch();
39 Dispatch.put(pageSetup, "Orientation", new Variant(2));
40 Dispatch.call(sheet, "PrintOut");
41 }
42 // 开始打印
43 if (excel != null) {
44 //Dispatch.call(excel, "PrintOut");
45 //增加以下三行代码解决文件无法删除bug
46 Dispatch.call(excel, "save");
47 Dispatch.call(excel, "Close" , new Variant(true));
48 excel=null;
49 }
50 xl.invoke("Quit", new Variant[] {});
51 xl=null;
52 return true;
53 } catch (Exception e) {
54 e.printStackTrace();
55 return false;
56 } finally {
57 // 始终释放资源
58 ComThread.Release();
59 }
60 } else if (postfixString.equalsIgnoreCase("doc")
61 || postfixString.equalsIgnoreCase("docx")) {
62 ComThread.InitSTA();
63 ActiveXComponent wd = new ActiveXComponent("Word.Application");
64 try {
65 // 不打开文档
66 Dispatch.put(wd, "Visible", new Variant(false));
67 Dispatch document = wd.getProperty("Documents")
68 .toDispatch();
69 // 打开文档
70 Dispatch doc = Dispatch.invoke(document, "Open",
71 Dispatch.Method, new Object[] { f.getAbsolutePath() },
72 new int[1]).toDispatch();
73 // 开始打印
74 if (doc != null) {
75 Dispatch.call(doc, "PrintOut");
76 //增加以下三行代码解决文件无法删除bug
77 Dispatch.call(doc, "save");
78 Dispatch.call(doc, "Close" , new Variant(true));
79 doc=null;
80 }
81 wd.invoke("Quit", new Variant[] {});
82 wd=null;
83 return true;
84 } catch (Exception e) {
85 e.printStackTrace();
86 return false;
87 } finally {
88 // 始终释放资源
89 ComThread.Release();
90 }
91 } else {
92 return false;
93 }
94 } else {
95 return false;
96 }
97 }