专栏首页早起Python看完这篇Python操作PPT总结,从此使用Python玩转Office全家桶就没有压力了!

看完这篇Python操作PPT总结,从此使用Python玩转Office全家桶就没有压力了!

一、导读

大家好,今天依旧是Python办公自动化基础系列,在之前我们分别详细讲解了

今天本文将基于第三方库pptx,详细讲解如何使用Python操作Office全家桶最后一位——PPT。

二、安装

pptx是一个非标准库,需要在命令行中安装

pip install python-pptx

要注意,安装的时候是python-pptx,而实际调用时均为pptx。这里和docx模块相同

三、前置知识

1. 基本结构

再看一下ppt结构组成,会较word复杂许多。当然这也跟ppt的高度自定义拓展性有关

简单来说,一个PPT文件为presentation基本的结构为展示文件presentation-幻灯片页slide-形状shape组成,形状就需要区分开,是包含文本的形状还是不包含文本的形状(纯图片等)。

如果是包含文本的形状,则可以获取内部的文本框,一个文本框又可以看作是一个小的word文档,包含段落paragraph - 文字块run

现在对Office三件套的结构组成做一个小总结?

2. 模板和占位符

如上图所示,通过幻灯片母版我们可以预设好各种各样的版式,后面新建幻灯片的时候只需要点击版式就可以一键生成所需的基本格式。

接着说说占位符Placeholder

占位符已经完成了样式设置,包括字体、字号、颜色等等,在特定占位符内输入文字可直接转化为特定的样式

3. 创建 PPT 文件的基本思路

  • 创建一个 PPT
  • 从幻灯片母版中确定一个版式
  • 在不同的占位符中填写不同的内容
  • 添加图片、表格等额外内容
  • 对样式进行修改

四、Python读取PPT

1.打开PPT文件

from pptx import Presentation
# 这里给出需要打开的文件路径
file_path = r'...'
pptx = Presentation(file_path)

2. 获取幻灯片页

pptx.slides可以获得一个列表,包括所有的幻灯片页slide 对象

for slide in pptx.slides: 
    print(slide)

3. 获取形状

只要熟悉了类似 Excel 和 Word 的多级结构, PPT 的结构就很好理解了。每一个幻灯片页都有一个或者多个形状shape

for slide in pptx.slides: 
    for shape in slide.shapes: 
        print(shape)

4. 获取文本框内容

要获取文字内容,很容易就联系到文字在形状 shape 的下级结构了 从 Word 中的学习我们也可以推知,文字的承载单位是 段落 paragraph文字块 run

很自然可以想到用下列的代码获取文字

for slide in pptx.slides: 
    for shape in slide.shapes: 
        for paragraph in shape.paragraphs: 
            print(paragraph.text)

或者

for slide in pptx.slides:
    for shape in slide.shapes:
        for paragraph in shape.paragraphs:
            for run in paragraph.runs:
                print(run.text)

但这里出现了一个问题:每个形状里一定有文字吗?

从上图可以看到,蓝色椭圆的形状里是没有任何文字的,中间的大虚线框有文字

一个形状中有没有文字,关键就在于它有没有包含文本框text_frame,下面是与文本框有关的操作:

  • shape.has_text_frame 判断形状中是否有文字框
  • shape.text_frame 获取文字内容

在PPT中,文字框才是文字的载体,因此获取文字的代码如下:

for slide in pptx.slides: 
    for shape in slide.shapes: 
        if shape.has_text_frame: 
            text_frame = shape.text_frame 
            print(text_frame.text)

到这里,我们需要对先前对 PPT 结构的认识进行修正:

5. 获取段落和文字块

每一个文本框都可以看成是一个小的 Word 文件,里面有段落和文字块两级结构:

for slide in pptx.slides: 
    for shape in slide.shapes: 
        if shape.has_text_frame: 
            text_frame = shape.text_frame 
            for paragraph in text_frame.paragraphs: 
                for run in paragraph.runs: 
                    print(run.text)

五、写入 PPT

创建全新 PPT 的代码可以类比创建 Word 文件的代码,实例化的过程中不给予具体路径则为创建空白文件

1. 创建幻灯片页

其中占位符编号是区分占位符的依据,也是写入内容的依据

2. 往占位符填写内容

指定占位符编号就可以在具体位置写入特定内容

slide.placeholders[占位符编号].text = '...' 

六、修改 PPT 样式

1. 段落样式修改

可以同python-docx模块对段落样式的导入进行类比

具体的方法上二者也有很多相似:

  • .add_run():添加新的文字块
  • .line_spacing:段内行间距
  • .runs :段落内的所有文字块
  • .space_after :段后距
  • .space_before :段前距

2. 文字样式修改

文字样式方法和 Word 中的使用是相同的:

  • .font.name :字体名称
  • .font.bold :是否加粗
  • .font.italic :是否斜体
  • .font.color :字体颜色
  • .font.size:字体大小

但有一个地方需要加以区别:在python-pptx中,使用文字样式方法是基于段落,也就是paragraph.font.xxxx, 而在python-docx中,使用文字样式方法是基于文字块

写在最后

以就是对 python-pptx模块操作PPT的常见方法总结,处理日常办公绝对没有问题,更多详细的代码可以查阅官方文档。

学完了这篇Python操作PPT之后,有关Python操作Word、Excel、PPT、PDF的基础就全部讲解完毕,之后我们会继续更新使用这些工具实现自动化办公的案例,如果你还不知道具体该如何应用,下面这些案例可能会有所帮助:

-END-

本文内容及图片为公众号早起Python专栏作者陈熹原创,转载请后台联系授权,一切未经授权的转载均视为侵权!

本文分享自微信公众号 - 早起Python(zaoqi-python),作者:陈熹

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-09-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 多图+代码 | 详解Python操作Excel神器openpyxl的各种操作!

    大家好,在之前的十几篇办公自动化系列文章中,我们大多是以真实的案例需求来讲解Python如何进行自动化办公操作,并且多次使用到openpyxl来处理表格,今天我...

    刘早起
  • NumPy进阶修炼|基础

    大家好,我们接着更新NumPy专题,想学好NumPy先搞定基础,本文将细致讲解一些NumPy的基础操作,记得启动Jupyter Notebook一边敲一边学,我...

    刘早起
  • 原理+代码|Python实战多元线性回归模型

    「多元线性回归模型」非常常见,是大多数人入门机器学习的第一个案例,尽管如此,里面还是有许多值得学习和注意的地方。其中多元共线性这个问题将贯穿所有的机器学习模型,...

    刘早起
  • Unity3D 物体移动方式总结

    在Unity3D中,有多种方式可以改变物体的坐标,实现移动的目的,其本质是每帧修改物体的position。

    bering
  • 9,函数定义

    Python的函数具有非常灵活的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。

    lyhue1991
  • keras中文文档

    Keras是一个极简和高度模块化的神经网络库,Keras由纯Python编写而成并基于Theano或Tensorflow。Keras 为支持快速实验而生,如果你...

    用户1908973
  • 在线功能富集分析与qPCR引物设计

    之前写的RNA-seq数据差异表达分析一文中提到,筛选得到差异表达基因list后,需要进一步分析这些基因参与了哪些功能,因此要进行后续的一些分析,比如功能富集分...

    阿凡亮
  • R语言系列第二期:①R变量、脚本、作图等模块介绍

    在这些内容的基础上,我们在这个部分为大家介绍一些实用知识,包括描述工作区结构、图形设备以及它们的参数等问题,还有初级编程和数据输入输出。

    微点
  • 汉字使用默认解码出现问题

    老生常谈的一个问题,汉字编码与解码问题,各种编码就不再复制粘贴了,需要的话维基百科捡起来再看看。

    gigiwangs
  • UITableViewController和延时执行、自定义控件

    1、在UITableViewController中,self.view就是self.tableView, 两个对象的指针地址是一样的

    tandaxia

扫码关注云+社区

领取腾讯云代金券