带你用Python玩转PPT

2020 年 10 月 8 日 CSDN
作者  | 陈熹
来源 |  早起Python(ID:zaoqi-python)
头图 |  CSDN 下载自东方IC


导读


大家好,今 天依旧是 Python办公自动化基础系列 ,在之前我们分别详细讲解了

今天本文将基于第三方库 pptx,详细讲解如何使用Python操作Office全家桶最后一位——PPT。


安装


pptx 是一个非标准库,需要在命令行中安装

pip install python-pptx

要注意,安装的时候是 python-pptx,而实际调用时均为 pptx。这里和 docx模块相同。


前置知识


1、基本结构

再看一下ppt结构组成,会较word复杂许多。当然这也跟ppt的高度自定义拓展性有关

简单来说,一个PPT文件为presentation,基本的结构为展示文件presentation-幻灯片页slide-形状shape组成,形状就需要区分开,是包含文本的形状还是不包含文本的形状(纯图片等)。

如果是包含文本的形状,则可以获取内部的文本框,一个文本框又可以看作是一个小的word文档,包含段落paragraph - 文字块run

现在对Office三件套的结构组成做一个小总结👇 2、模板和占位符
如上图所示,通过幻灯片母版我们可以预设好各种各样的版式,后面新建幻灯片的时候只需要点击版式就可以一键生成所需的基本格式。

接着说说占位符 Placeholder占位符已经完成了样式设置,包括字体、字号、颜色等等,在特定占位符内输入文字可直接转化为特定的样式

3、创建 PPT 文件的基本思路

  • 创建一个 PPT
  • 从幻灯片母版中确定一个版式
  • 在不同的占位符中填写不同的内容
  • 添加图片、表格等额外内容
  • 对样式进行修改


Python读取PPT


1、打开PPT文件

from pptx import Presentation# 这里给出需要打开的文件路径file_path = r'...'pptx = Presentation(file_path)

2、获取幻灯片页

pptx.slides 可以获得一个列表,包括所有的幻灯片页 slide 对象

for slide in pptx.slides:     print(slide)

3、获取形状

只要熟悉了类似 Excel 和 Word 的多级结构, PPT 的结构就很好理解了。每一个幻灯片页都有一个或者多个形状 shape

for slide in pptx.slides:     for shape in slide.shapes:         print(shape)

4、获取文本框内容

要获取文字内容,很容易就联系到文字在形状 shape 的下级结构了 从 Word 中的学习我们也可以推知,文字的承载单位是 段落 paragraph文字块 run

很自然可以想到用下列的代码获取文字

for slide in pptx.slides:     for shape in slide.shapes:         for paragraph in shape.paragraphs:             print(paragraph.text)

或者

for slide in pptx.slides:    for shape in slide.shapes:        for paragraph in shape.paragraphs:            for run in paragraph.runs:                print(run.text)

但这里出现了一个问题:每个形状里一定有文字吗?从上图可以看到,蓝色椭圆的形状里是没有任何文字的,中间的大虚线框有文字

一个形状中有没有文字,关键就在于它有没有包含文本框 text_frame,下面是与文本框有关的操作:

  • shape.has_text_frame 判断形状中是否有文字框
  • shape.text_frame 获取文字内容

在PPT中,文字框才是文字的载体,因此获取文字的代码如下:

for slide in pptx.slides:     for shape in slide.shapes:         if shape.has_text_frame:             text_frame = shape.text_frame             print(text_frame.text)

到这里,我们需要对先前对 PPT 结构的认识进行修正:

5、获取段落和文字块

每一个文本框都可以看成是一个小的 Word 文件,里面有段落和文字块两级结构:

for slide in pptx.slides:     for shape in slide.shapes:         if shape.has_text_frame:             text_frame = shape.text_frame             for paragraph in text_frame.paragraphs:                 for run in paragraph.runs:                     print(run.text)


写入 PPT


创建全新 PPT 的代码可以类比创建 Word 文件的代码,实例化的过程中不给予具体路径则为创建空白文件

1、创建幻灯片页

其中占位符编号是区分占位符的依据,也是写入内容的依据

2、往占位符填写内容

指定占位符编号就可以在具体位置写入特定内容

slide.placeholders[占位符编号].text = '...' 


修改 PPT 样式


1、段落样式修改

可以同 python-docx 模块对段落样式的导入进行类比具体的方法上二者也有很多相似:

  • .add_run(): 添加新的文字块
  • .line_spacing: 段内行间距
  • .runs : 段落内的所有文字块
  • .space_after : 段后距
  • .space_before : 段前距

2、文字样式修改

文字样式方法和 Word 中的使用是相同的:

  • .font.name : 字体名称
  • .font.bold : 是否加粗
  • .font.italic : 是否斜体
  • .font.color : 字体颜色
  • .font.size: 字体大小

但有一个地方需要加以区别:在 python-pptx 中,使用文字样式方法是基于段落,也就是 paragraph.font.xxxx, 而在 python-docx 中,使用文字样式方法是基于文字块学完了这篇Python操作PPT之后,有关Python操作Word、Excel、PPT、PDF的基础就全部讲解完毕,之后我们会继续更新使用这些工具实现自动化办公的案例,如果你还不知道具体该如何应用,下面这些案例可能会有所帮助:


更多精彩推荐

JavaScript 爆红后,微软为何还要开发 TypeScript?

打通语言理论和统计 NLP 两个世界,Transformers/GNNs 架构能做到吗?

2020互联网公司中秋礼盒大比拼!(文末送福利)

自拍卡通化,拯救动画师,StyleGAN再次玩出新花样

还不懂Redis?看完这个故事就明白了!

区块链+生鲜:杜绝“偷梁换柱”和“以次充好”
            
            
              
点分享
点点赞
点在看

登录查看更多
0

相关内容

【2020干货书】Python3基础导论介绍,98页pdf
专知会员服务
100+阅读 · 2020年10月11日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
22+阅读 · 2019年11月7日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
将Python用于NLP:Pattern 库简介
Python程序员
15+阅读 · 2019年6月7日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
实战 | 用Python做图像处理(三)
七月在线实验室
15+阅读 · 2018年5月29日
实战 | 用Python做图像处理(一)
七月在线实验室
25+阅读 · 2018年5月23日
Python 如何快速入门?
全球人工智能
6+阅读 · 2018年3月15日
Python | 50行代码实现人脸检测
计算机与网络安全
3+阅读 · 2018年1月23日
Tensorflow 文本分类-Python深度学习
Python程序员
12+阅读 · 2017年11月22日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
Emotion Detection using Image Processing in Python
Arxiv
0+阅读 · 2020年12月1日
Arxiv
4+阅读 · 2018年6月5日
Arxiv
20+阅读 · 2018年1月17日
Arxiv
6+阅读 · 2017年12月7日
VIP会员
相关VIP内容
【2020干货书】Python3基础导论介绍,98页pdf
专知会员服务
100+阅读 · 2020年10月11日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
22+阅读 · 2019年11月7日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
相关资讯
将Python用于NLP:Pattern 库简介
Python程序员
15+阅读 · 2019年6月7日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
实战 | 用Python做图像处理(三)
七月在线实验室
15+阅读 · 2018年5月29日
实战 | 用Python做图像处理(一)
七月在线实验室
25+阅读 · 2018年5月23日
Python 如何快速入门?
全球人工智能
6+阅读 · 2018年3月15日
Python | 50行代码实现人脸检测
计算机与网络安全
3+阅读 · 2018年1月23日
Tensorflow 文本分类-Python深度学习
Python程序员
12+阅读 · 2017年11月22日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
Top
微信扫码咨询专知VIP会员