专栏首页Python小屋Python提取docx文档中所有嵌入式图片和浮动图片

Python提取docx文档中所有嵌入式图片和浮动图片

术语:

浮动图片,是指在Word文档中位置可以自由移动、可以环绕文字或放置于文字上方、下方的图片,不占文档流的位置,可以和文字或嵌入式图片重叠。

嵌入式图片或行内图片,和文档中的文字一样占文档流的位置,不能自由移动位置,也不能环绕文字,不能放置于文字的上方或下方。直接插入Word文档的图片默认为嵌入式图片,如果改为浮动图片,需要单独设置。

==============

首先,我们准备一个文件“包含图片的文档.docx”,里面放几个图片,设置其中几个图片浮动,分别位于文字下方和文字上方,再写几个字,如图:

然后使用扩展库python-docx提取其中的图片,目前这个库似乎只支持嵌入式图片的提取,不支持浮动图片,有知道的朋友请留言告知,测试成功后可以获赠董老师任意图书一本。

参考代码:使用Python批量提取并保存docx文档中的图片

提取结果:

改用扩展库docx2python,官方对这个扩展库的简单描述如下:

首先使用pip命令安装这个扩展库,如图:

参考代码:

提取结果:

除了提取图片之外,obj还具有下面的属性可以提取docx文档中不同部分,请自行查阅资料了解其用法。

本文分享自微信公众号 - Python小屋(Python_xiaowu),作者:董付国

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python+tkinter模拟京东旋转图片式验证码输入

    使用Python+tkinter编写程序,运行程序后,界面上随机显示4个图片,单击每个图片可以旋转,4个图片都旋转至方向一致时表示验证码输入正确。

    Python小屋屋主
  • Python常用运算符含义与用法演示

    +运算符除了用于算术加法,还可以用于列表、元组和字符串的合并或连接,生成新对象: >>> 3 + (3+4j) #整数和复数相加 (6+4...

    Python小屋屋主
  • 使用Python批量提取并保存docx文档中的图片

    如果实在看不懂上面的代码,但是又有同样的功能需要,可以把test.docx文件复制一份并把扩展名改为zip,文件名为“test_副本.zip”,然后解压缩,可以...

    Python小屋屋主
  • 优秀技术文档的书写姿势

    文档写的清楚,思路就更加清晰,也会让同事高看你一眼,多梳理业务也有很大帮助。

    xcbeyond
  • 维基解密公开CIA机密文档追踪工具Scribbles源码(别名为“Snowden Stopper”)

    既今年三月初开始,维基解密披露了一系列CIA Vault7 文档。4月28日维基解密再度公开了该系列中名为 Scribbles 的相关文件及其源代码。Scrib...

    FB客服
  • 求你别再用swagger了,给你推荐几个在线文档生成神器

    最近公司打算做一个openapi开放平台,让我找一款好用的在线文档生成工具,具体要求如下:

    苏三说技术
  • 纯Python 实现 Word 文档转换 Markdown

    随着 SaaS 服务的流行,越来越多的人选择在各个平台线上编写文档,制作表格并进行分享。

    州的先生
  • redis 五种数据类型存储测试

    本文主要记录使用 redis 五种数据类型分别存储200万条数据,测试未考虑业务场景,单纯从数据存储进行。使用五种数据类型对相同的数据进行存储,使用容量从大到小...

    宋文剑
  • 【Linux】一招跑满你的cpu

    runzhliu
  • iOS-世界那么大,CoreLocation带你去看看

    xx_Cc

扫码关注云+社区

领取腾讯云代金券