Python操作OpenOffice

OpenOffice是一个免费的、开源的办公套装,集成了允许开发者用不同语言进行开发的API。Python-UNO让你可以在Python环境下使用OpenOffice。本文简要介绍了一下Python-UNO的使用方法。

OpenOffice.org作为一款免费的开源Office套装,提供了强大的、兼容的解决方案,这为它树立了相当好的口碑。据它所称,下载次数已经超过了五千万次了,而且它可以在多个平台上运行。开发者很难忽视这样一个项目,这也是OpenOffice.org为什么要提供API允许开发者在不同语言环境下使用OpenOffice.org的原因了。

当然了,你可能很难想像Python也包含在OpenOffice.org允许使用的语言列表中,因为Python会让事情变得“太简单”了。而Python-UNO恰恰把一切变成可能。OpenOffice.org利用了通用网络对象(Universal Network Objects,UNO)。这项技术使得OpenOffice.org可以与不同语言写成的部件兼容协作。Python-UNO提供了使用它的一个Python接口。

Python-UNO包含在OpenOffice.org里,所以不需要再安装其他东西了。不幸的是,这有一个缺点。由于OpenOffice.org 2.0里包含的Python版本是2.3.5,所以无法使用最近添加的功能。当然也有人在努力解决这个问题,让OpenOffice.org跟新一些的Python版本兼容。

也有一些linux发行版默认安装Python的时候也配置了Python-UNO使之可以工作,比如Ubuntu就是这么做的。你可以运行Python尝试import uno模块看看行不行。如果可以的话,就让我们开始使用Python-UNO吧。

连接OpenOffice.org

首先我们先连接OpenOffice.org,只有几个小步骤,很简单。在连接OpenOffice.org之前,我们要先确保它一直在监听。这包括在启动它的时候传递一个字符串给它。首先,确保OpenOffice.org完全退出(如果用的是Windows系统,还需要从系统盘中退出OpenOffice.org),然后打开终端,切换到OpenOffice.org的安装目录,并进入执行文件所在目录。接下来,我们将打开OpenOffice.org Writer,传入一个参数,允许OpenOffice.org监听到我们之后要做的连接:

这样打开的OpenOffice.org跟普通方式打开的外观是没有差别的。我们传递的参数创建了一个UNO接收器,它会监听我们以便通过Python-UNO和OpenOffice.org的API进行连接。在新窗口打开程序所在目录,找到OpenOffice.org的Python版本并执行之,这样会进入可交互的解释器。另外,如果你知道你的Linux发行版默认安装的Python里已经包括了Python-UNO,那你可以像往常一样打开Python。

第一步当然就是导入Python-UNO模块啦,名字是uno:

必须做的第一件事是导入一个本地的组件上下文。如果你想彻底弄清楚什么是组件上下文以及它的用途,你可以自行google。这里,我们稍稍解释一下。一个上下文管理器由一个服务管理器和相关对象组成,把它当成服务管理器存在的环境就是了。

那服务管理器是什么呢?顾名思义,服务管理器用来管理服务。它的名字就是其功能的简单定义。最后解释一下服务。服务就是绑定了一系列特定任务的对象。比如说,有一个特定的服务负责加载和管理文档,另一个用来连接OpenOffice.org的设置。服务是由服务管理器进行管理的,服务管理器存在于一个组件上下文。当然啦,事情没那么简单,但是这里我们不需要用到其他的知识。

简单介绍了一下组件上下文,服务管理器和服务这几个概念后,让我们继续,创建一个本地的组件上下文。我们之后会用它来获取OpenOffice.org的组件上下文:

现在我们有了一个本地组件上下文。接下来,我们还要获取UnoUrlResolver服务。这个服务用于连接OpenOffice.org。我们需要利用服务管理器的createInstanceWithContext方法,这个方法在local.ServiceManager中。参数设为我们想要的服务名称,和上下文实例:

这样我们就可以连接OpenOffice.org了。很简单,只要调用一个方法,把参数设成我们启动OpenOffice.org Writer时传递的参数就可以了。之后,我们就可以利用OpenOffice.org的组件上下文,通过OpenOffice.org的API对它进行操作了:

参数跟启动OpenOffice.org时的参数仅有微小的区别,只是加了“StarOffice.ComponentContext”请求OpenOffice.org的组件上下文而已。我们还添加了个协议(uno)在最前面。现在,我们已经连接上了OpenOffice.org。

使用桌面服务

既然我们可以使用OpenOffice.org的API,那么让我们来操作一下文件吧。我早前提到过有一个服务是负责当前文档的。这个服务的名称是“com.sun.star.frame.Desktop”。通过这个服务我们就可以玩转启动OpenOffice.org时创建的OpenOffice.org Writer文档了。首先,我们需要用前面说过的createInstanceWrithContext方法拿到服务,参数是服务名称和context。

很好,现在我们有了Desktop服务了,也有能力加载文档并管理文档了。我们先尝试修改当前文档。用getCurrentComponent方法:

修改文档前,要先创建一个游标cursor。这很简单:

通过游标,我们可以往文档里添加一些内容。先试着加一段简单的字符串:

执行上面代码后,你应该可以看到文档中多出一行文本。加入断行符可以向文档中加入换行:

简单的缩进也很容易实现。只要加入一个缩进符“t”:

当然了,重复性地添加文本是无效的,这就是我们要操作游标的原因了。比如说,我们想把大一号的字体。这很容易通过游标属性实现。UNO对象包括了属性,这些属性可以用很简单的方法调用进行修改。在我们改变游标字体尺寸前,我们先获取目前的字体大小:

如你所见,字体尺寸属性的名称叫“CharHeight”。调用另一个方法可以修改这个属性。让我们把字体大小改成20:

现在字体大小已经改变了,我们可以添加一些字体大小为20的文本进文档里了:

不只是文字尺寸可以改变,基本上所有东西都能改变。让我们改变字体和字体粗细:

浅谈表格

工作中经常要用到表格,让我们看一下怎么在Python-UNO里使用表格。先打开一个新的文档:

在新的空白文档上开始使用表格。我们要做的表格包含五个国家,还有每个国家的人口。所以,这个表格会有6行,其中一行是表头;还有2列。下面是创建表格的命令:

当然,我们需要把表格的行数和列数传递给population。下面是初始化函数:

如果你看一下打开的文档,你还什么都看不到。你要插入这个表格,才看得到。表格的插入跟文本插入是类似的:

现在可以开始插入表格内容了。包括两个步骤,说明每个单元格的名字,然后插入文本。表格的第一行命名为“A”,第一列命名为“1”.这个命名模式持续到表格最后,每一个单元格的名字都是行名和列名的组合。先插入表头:

接下来,可以把国家信息填进去了:

结论

OpenOffice.org是相当强大的工具,特别是它还提供了可以被很多不同语言调用的API。幸运的是,这些语言里包括了Python,即Python-UNO。Python开发者们可以导入这个模块,然后创建一个本地组件上下文环境,这个环境能用来连接OpenOffice.org的上下文环境。连接后,开发者可以修改文档。虽然这篇文章只涉及了插入文本和表格还有改变字体属性,但是OpenOffice.org的API还提供了很多功能。有很多方法可以修改文本和表格。虽然我们只讲了OpenOffice.org的Writer软件,但是还有OpenOffice.org套装的其他应用可以使用。

从这篇文章开始,还有很多功能值得你去探究。现在你可以试着写一些脚本自动创建文档了。如果你还想要其他特性,你可以参考这个网站: http://api.openoffice.org/docs/common/ref/com/sun/star/module-ix.html

相关文章:

python Big Data Company Gets DARPA Funding

Python 32 Now available

Final Alpha for Python 3.2 is released

Documenting Your Project (edited - lorraine)

英文原文:http://www.devshed.com/c/a/python/python-and-openoffice-org/ 译者:Alston


原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2017-12-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏零基础使用Django2.0.1打造在线教育网站

利用Flask搭建微电影视频网站(三):前端首页搭建

努力与运动兼备~~~有任何问题可以加我好友或者关注微信公众号,欢迎交流,我们一起进步!

91110
来自专栏守望轩

Visual Studio 2008 每日提示(十二)

#111、定义最近使用的列表中显示项的数目 原文链接:How to customize the number of items shown in the re...

37640
来自专栏Seebug漏洞平台

Bypass unsafe-inline mode CSP

[+] Author: evi1m0 [+] Team: n0tr00t security team [+] From: http://www.n0tr0...

34740
来自专栏从零开始学自动化测试

selenium+python自动化78-autoit参数化与批量上传

前言 前一篇autoit实现文件上传打包成.exe可执行文件后,每次只能传固定的那个图片,我们实际测试时候希望传不同的图片。 这样每次调用的时候,在命令行里面加...

38930
来自专栏zaking's

走近webpack(3)--图片的处理

  上一章,咱们学了如何用webpack来打包css,压缩js等。这一篇文章咱们来学习一下如何用webpack来处理图片。废话不多说,咱们开始吧。   首先,咱...

38170
来自专栏CSDN技术头条

由浅入深学习JavaScript Debug技巧

我常常看到不少开发者不懂如何Debug JavaScript代码,因此决定写一篇博客为初学者介绍如何Debug。我希望这篇文章可以提供一些有用的信息。我尝试在本...

19290
来自专栏同步博客

XSS跨站脚本攻击

跨站脚本(cross site script)为了避免与样式css混淆,所以简称为XSS。

23330
来自专栏编程之旅

Vim——使用NerdTree来畅快的打开文件吧

在上一章我介绍完用Vundle来管理Vim中所有的插件后,今天我又要强推一个Vim的文件管理插件Nerdtree,相信所有使用Vim的同学都知道文件管理插件Ne...

70920
来自专栏一个会写诗的程序员的博客

webpack 极简教程(前端自动化构建)

Webpack 是一个前端资源加载/打包工具。它将根据模块的依赖关系进行静态分析,然后将这些模块按照指定的规则生成对应的静态资源。

11610
来自专栏王小雷

Ubuntu16.04安装后开发环境配置和常用软件安装

Ubuntu16.04安装后1.安装常用软件搜狗输入法+编辑器Atom+浏览器Chome+视频播放器vlc+图像编辑器GIMP Image Editor安装+视...

40350

扫码关注云+社区

领取腾讯云代金券