前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【程序源代码】Pdf转Word工具

【程序源代码】Pdf转Word工具

作者头像
程序源代码
发布2022-08-26 17:52:00
1.3K0
发布2022-08-26 17:52:00
举报
文章被收录于专栏:程序源代码程序源代码

  “ 关键字:  “ python PDF转WORD 工具 

01

————

【总体介绍】

作为一名计算机电脑办公人员和使用者。我们在实现工作中或者日常学习中经常会遇到这个办公场景。经常需要 "将PDF格式文件转换为 WORD文件",也就是说将PDF中的文字、图片、报表等只读的内容转换成可以为WORD编辑的状态,即将只读转换成可编辑的格式。这个办公场景想想大家都在实际工作和学习中都遇到过。

原来我们做的方式有好多种:1、在网络购买可相关软件,付费花钱卖转换工作 2、或者在网上充各类的会员或者VIP,有的会员按照月收费,比如一个月多少钱,甚至有的软件按照页数收费 ,转换一页需要多少钱。作为一名经常用盗版软件或者穷苦大众来说,这些钱花的有点冤枉。有时甚至囊中羞涩只能自己一个字一个字对照PDF敲文本了。

但科技发达的今天,我们就需要想办法通过软件能不能实现这个功能 。那今天就分享通过利用 Python实现批量将PDF转换成 Word,这样一款用于windows桌面小工具。通过简单的小工具实现pdf转word工具,这样即省钱又省力,何乐而不为呢。下面就开始今天的正题。

02

————

【源码使用说明】

一、软件开发环境和语言

首选介绍下开发中主要使用的语言:Python

开发环境:Python3.8;在开发中需要注意的是Python版本必须是3.6或以上,本软件在开发时使用的是Python3.8。

二、主要应用技术框架和组件

在开发pdf转word这个软件中,主要应用到python中一个非常实用和重要的组件框架: pdf2docx ;这个基础库是python为于处理pdf/word等文体而设计实现功能组件,这是python官方推荐使用用于处理文体场景时使用的基础库。它的基础功能就是可以将标准PDF文档,包含里面的图片、表格、文本等元素处理转换为可编辑、修改格式。

具体的python安装命令:pip install pdf2docx 

其中再给大家说一下,这个基础库和Python的代码库,基本是免费、开源,所以大家可以免费进行使用,不用考虑付费等情况;另外就是python 的基础库封装都比较良好,功能也比较成熟,其中很多的方法、接口直接调用使用就可以了,很是方便,这个小工具的代码量很少,通过几行简单的代码就能实现很复杂的功能,这也是python语言流行的主要原因之一吧。所以总之一句话:python大家可以放心使用。

三、python 绘制图形界面组件

因为我们要开发一个可以用于PC端可执行的小工具,这样就方便不懂程序的同学来进行使用,所以我们要把我们写好的程序作成方便使用的图形界面来使用。所以在开发这个小工具的时候我们就会用到python里面一个非常使用的绘制图形界面组件的基础库存:PySimpleGUI

具体的python安装命令:pip install PySimpleGUI 

Python组件包含了有许多处理图形(GUI)的工具包,这些工具包在使用方面基本都是大同小异,python gui使用起来比较简单。所以我们这里就选用这个基本库作为比绘制图形的开发包来使用的。

四、python 打包执行组件

因为我们要把开发好的程序打包成可以用于PC端执行的小工具,这里面呢我们就需要用到python打包执行组件库。

具体的python安装命令:pip install pyinstaller

03

————

【实现效果】

左边是pdf

右边是word

04

————

【代码获取】

这个里面的代码下载就可以了

下载地址:https://pan.baidu.com/s/17utjaBbZF1GjlOq4t2lHDQ?pwd=myrm

提取码:myrm

from pdf2docx import Converterimport PySimpleGUI as sgdef pdf2word(file_path):    file_name = file_path.split('.')[0]    doc_file = f'{file_name}.docx'    p2w = Converter(file_path)    p2w.convert(doc_file, start=0, end=None)    p2w.close()    return doc_filemain()

05

————

【视频】

为了让大家更加直观看懂,

正如是录制的短视频介绍此技术。

请大家观看(5分钟)

大家关注视频号

————

【联系方式】

公众号ID:  itcode

【公众号二维码, 扫一扫吧】

微信ID:  itcoder

【微信二维码, 扫一扫吧】

【写作说明】以上文章属于此公众号原创所有,如需转载请注明出处。【免责申明】本公众号不是广告商,也没有为其他三方网站或者个人做广告宣传。文章发布源代码和文章均来源于各类开源网站社区或者是小编在项目中、学习中整理的一些实例项目。主要目的是将开源代码分享给喜欢编程、有梦想的程序员,希望能帮助到你们与他们共同成长。其中用户产生的一些自愿下载、打赏或者付费行为,原则与平台没有直接关系。如果涉及开源程序侵犯到原作者相关权益,可联系小编进行相关处理。

【投稿邮箱】315997972@qq.com

—————————————

目前已有1000000+优秀的程序员加入我们

———————

————————

【你的每一份打赏就是对我最真诚的鼓励】

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序源代码 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
AI 应用产品
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档