专栏首页机器学习与统计学6行代码!用Python将PDF转为word

6行代码!用Python将PDF转为word

pdf转word应该算是一个很常见的需求了 网上有些免费的转换工具,一方面不安全,有文件泄露风险,另一方面有免费转换的次数限制。 今天向大家分享一个很好用的工具:pdf2docx

安装

$ pip install pdf2docx

用法也很简单,核心方法是Converter 我写了一个小脚本,如有需要,大家可以直接copy走。

# -*- coding: utf-8 -*-
"""
Created on Sat Aug  7 16:36:59 2021

@author: LaoHu
"""
import argparse
from pdf2docx import Converter

def main(pdf_file,docx_file):
    cv = Converter(pdf_file)
    cv.convert(docx_file, start=0, end=None)
    cv.close()
    
if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--pdf_file",type=str)
    parser.add_argument('--docx_file',type=str)
    args = parser.parse_args()
    main(args.pdf_file,args.docx_file)

用法

python pdf2word.py --pdf_file  pdf文件路径\example.pdf --docx_file 输出word文件的路径\example.docx

不喜欢命令行跑脚本的同学可以copy下面简化版

from pdf2docx import Converter
pdf_file = 'pdf文件路径'
docx_file = '输出word文件的路径'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()

本文分享自微信公众号 - 机器学习与统计学(tjxj666),作者:老胡

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 手把手 | 20行Python代码教你批量将PDF转为Word

    大数据文摘
  • 27行Python代码批量将ppt转换为pdf

    这是一个Python脚本,能够批量地将微软Powerpoint文件(.ppt或者.pptx)转换为pdf格式。 使用说明 1、将这个脚本跟PPT文件放置在同一...

    小小科
  • 使用python将word文档转换为PDF文档

    对于windows系统的编程开发,微软一开始提供了基于VB语言的接口,后来又推出了.NET框架。对于word等offices套件的自动化操作,由于原生支持的特性...

    生信修炼手册
  • 60行Python代码,实现多线程PDF转Word

    工作中经常会遇到需要提取PDF文件中文字的情况,一个PDF还好,复制粘贴一下也花不了太多时间,如果需要把大量PDF转为Word,怎么办呢?

    simpleapples
  • 60行Python代码,实现多线程PDF转Word

    工作中经常会遇到需要提取PDF文件中文字的情况,一个PDF还好,复制粘贴一下也花不了太多时间,如果需要把大量PDF转为Word,怎么办呢?

    一墨编程学习
  • Python代码批量将ppt转换为pdf

    这是一个Python脚本,能够批量地将微软Powerpoint文件(.ppt或者.pptx)转换为pdf格式。

    菲宇
  • 用Python将HTML转为PDF。

    本次没有去设置详细的PDF参数,所以生成的PDF排版并不是很友好,不过还是能凑合看的。

    小F
  • 使用Python为PDF文件批量添加水印的方法及进一步思考

    想用Python把WORD文件转成PDF文件并加上水印。网上搜了一下资料,没发现有现成的解决方案。于是决定自己写一个Python程序。思路是分两步:第一步,将W...

    Python小屋屋主
  • 使用Python转换PDF,Word/Excel/PPT/md/HTML都能转!

    今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Python的好处不仅可以批量转换,同时一旦脚本写...

    刘早起
  • 使用Python转换PDF,Word/Excel/PPT/md/HTML都能转!

    今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Python的好处不仅可以批量转换,同时一旦脚本写...

    刘早起
  • 利用cython将python转为c代码

    3. gcc `python-config --cflags` `python-config --ldflags` test.c -o test

    py3study
  • Python 自动化办公-玩转 Word

    只要是简单重复的工作,就想办法用 Python 来帮你解决吧,人生苦短,你需要 Python。

    somenzz
  • Python自动化办公之Word,全网最全看这一篇就够了

    使用Python操作word大部分情况都是写操作,也有少许情况会用到读操作,在本次教程中都会进行讲解,本次课程主要用到以下4个库,请大家提前安装。

    Python小二
  • 太方便了!利用Python对批量Pdf转Word

    在wps或者office里面可以将pdf转word,不过只能免费转前面5页,超过5页就需要会员。今天教大家一个Python办公小技巧:批量Pdf转Word ,这...

    Python研究者
  • Python办公自动化之Word文档自动化:全网最全,看这一篇就够了!

    https://blog.csdn.net/u014779536/article/details/108418066

    小F
  • 太方便了!利用Python对批量Pdf转Word

    在wps或者office里面可以将pdf转word,不过只能免费转前面5页,超过5页就需要会员。今天教大家一个Python办公小技巧:批量Pdf转Word ,这...

    Python研究者
  • 办公利器!用Python快速将任意文件转为PDF

    痛点: 相信大家都会遇到一种场景。老师/上司要求你把某个文件转为pdf,并且是一批(不止一个,一个的话手动就可以搞定),并且这种是枯燥无聊的工作,既没有什么技术...

    Python研究者
  • 办公利器!用Python快速将任意文件转为PDF

    相信大家都会遇到一种场景。老师/上司要求你把某个文件转为pdf,并且是一批(不止一个,一个的话手动就可以搞定),并且这种是枯燥无聊的工作,既没有什么技术含量又累...

    Python研究者
  • 这52页pdf,顶10篇python自动化办公文章

    发现很多读者对python自动化办公(python操作Excel、Word、PDF)的文章都很喜欢,并希望能够应用到工作中去。

    朱小五

扫码关注云+社区

领取腾讯云代金券