前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何将pdf转换为word 2.0

如何将pdf转换为word 2.0

作者头像
生信菜鸟团
发布2020-06-04 10:14:28
2.5K0
发布2020-06-04 10:14:28
举报
文章被收录于专栏:生信菜鸟团

之前我们发布了如何将pdf转为word,期间陆续收到了小伙伴的推荐。

如何将pdf转化为word

今天我们整理一下,是为2.0版本。

再次以《新冠肺炎诊疗方案(试行第七版)》为例,该文件为图片性pdf,文字不可复制。

1.smallpdf网站

网址为:https://smallpdf.com/cn

该网站提供了一应俱全的玩转pdf工具

该网站是收费的,每月5欧

优点有:

没有限制

桌面版应用

移除广告

让PDF文件协助您更高效地工作

PDF转Word + 20种工具

批量处理

由于收费,我没有体验...

不过据小伙伴说,这是他已知转换质量最高的。感兴趣的可以试一下。

2.超级pdf网站

网址为:https://xpdf.net/pdf-to-word

需要先微信扫码关注公众号登录

它的优点是可以识别图片型pdf,且功能丰富

我们发现转换效果也很棒

3.pdf编辑器 Adobe Acrobat Pro

像所有的Adobe软件一样,强大的它拥有短暂免费试用时间。

打开文件后,依次选择“另存为其他—Word—Word文档”,等待转换。

效果还可以,就是中间空格比较多。

4.ABBYY

被称之为最强大的OCR软件

官网:https://www.abbyy.cn/finereader/

通过邮箱下载试用版

该试用版有30天是试用期,100页的试用页数

直接点击转换为word,并选择文件

保留了大部分原始格式

默认识别中文和英语

保留图片

保留页眉、页脚和页码

虽然也有空格,但这算是相对比较理想的一款了。

5.R

需要结合pdftools和tesseract两个R包,进行OCR提取

代码语言:javascript
复制
 pdf_ocr_text(
 pdf,  #file path or raw vector with pdf data
 pages = NULL, #which pages of the pdf file to extract
 opw = "", #string with owner password to open pdf
 upw = "",  #string with user password to open pdf
 language = "eng",  #passed to tesseract to specify the languge of the engine.
 dpi = 600  #resolution to render image that is passed to tesseract::ocr
 )

欢迎继续分享

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档