腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
OCRmyPDF
无
输出
python
、
python-3.x
、
pdf
、
ocr
、
google-colaboratory
我正在使用
OCRmyPDF
从扫描的pdf文件中提取文本。为此,我使用了this Colab notebook中的代码。到我运行的时候,一切看起来都很好: os.system(f'
ocrmypdf
{file_name} output.pdf') 而不是0,我得到了512!下一行,当我运行!
ocrmypdf
Performance Evaluations.pdf output.pdf时,我得到一条无法识别的错误消息,如下所示: usage:
ocrmypdf
[-h] [-l LANGUAGEskip-r
浏览 30
提问于2021-01-05
得票数 1
回答已采纳
1
回答
在终端中运行命令,并在
输出
中包含输入名
terminal
、
filenames
、
command
、
kubuntu
、
ocr
我在Dolphin服务菜单文件中有这一行,该文件包含用于PDF处理的许多其他命令:它的优点是提供表单MY_PDF_ocr.pdf的
输出
文件,从而保留输入文件的名称。为此,我可以用这句话:但是没有
输出
,保持输
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
bash脚本通过Docker调用
OCRmyPDF
的错误响应
linux
、
bash
、
shell
、
docker
编辑(更新):通过持续搜索和测试,我发现问题似乎在于$PWD (或$(dirs -l)或$(pwd))的
输出
被$PWD解释为相对路径,尽管它实际上是绝对的。然而,复制的,然后粘贴的$PWD,$(dir,-l),$(pwd)的
输出
仍然运行得很好。这个终端打印
输出
与bash传递给坞的同一个变量有什么不同? #!“,如果将回显
输出
复制到终端中,
浏览 0
提问于2015-05-13
得票数 2
1
回答
无法通过sh / crontab启动python程序
python
、
linux
、
shell
、
cron
我尝试从脚本或cronjob启动一个名为
ocrmypdf
的python程序。它从终点站运行得很好,usage:
ocrmypdf
[-h] [--verbose [VERBOSE]] [--version] [-L FILE]pi@piscan:~ $ sh
ocrmypdf
pi@piscan:~ $ which
ocrmypdf
/usr/local
浏览 4
提问于2016-01-02
得票数 0
回答已采纳
1
回答
在Python中将文本转换为DataFrame时数据自动隐藏
python
、
pandas
下面的代码是为打印提取的数据和
输出
也给出的。import osimport pdfplumberos.system(f'
ocrmypdf
{path} output.pdf')invoice= pdfplumber.open("output.pdf") count_pages= len(invoice.
浏览 11
提问于2022-03-31
得票数 -1
回答已采纳
1
回答
在Python中导入Visual Stdio代码中的
ocrmypdf
python
、
visual-studio-code
、
ocrmypdf
我想导入
ocrmypdf
。我已经使用pip install --upgrade --user
ocrmypdf
安装了这个包 但当我尝试使用以下命令在VSC中导入时: import
ocrmypdf
它捕获到错误: [WinError~\AppData\Roaming\Python\Python38\site-packages\
ocrmypdf
\__init__.py in <module> 11 from <e
浏览 57
提问于2021-06-22
得票数 0
回答已采纳
1
回答
使用从扫描PDF批量生成的OCR创建可搜索的PDF文件
pdf
、
ocr
其目标是自动将所有扫描文档转换为可搜索的PDF文件,而不仅仅是图像。扫描后的文档由扫描仪自动上传到Linux服务器上的共享文件中,作为PDF文件。要求:在后台自动工作,不需要任何额外的手动步骤。能够处理多页PDF文件
浏览 0
提问于2014-04-28
得票数 16
1
回答
AttributeError:模块“
ocrmypdf
”没有属性“ocr”
python
、
ocr
、
python-tesseract
我正在使用
ocrmypdf
库将扫描的pdf转换成可搜索的pdf,但我得到了这个错误。这是我目前正在运行的代码
ocrmypdf
.ocr('/content/drive/MyDrive/Dataset 2020/OCR/1081975.pdf', 'output.pdf')AttributeError: module '
ocrmypdf
' has no attri
浏览 5
提问于2020-11-24
得票数 1
回答已采纳
1
回答
如何创建高保真度PDF与可复制文本扫描?
pdf
、
scanner
、
text
、
ocr
一些公司通过扫描仪提供Windows软件,这些软件可以从扫描过的页面上创建PDF,这些页面看起来与扫描的内容完全一样(就好像它只是全页图像),但文本是可以识别和复制的。请注意,我不希望将扫描文本转换为常规文本。我想保持PDF外观的图片-完美的原始页面,但增加了一个公认的文本层,以方便使用。*即佳能与LiDE 220
浏览 0
提问于2017-09-24
得票数 4
回答已采纳
2
回答
如何使用gnu并行编写批处理命令?
python-3.x
、
bash
、
parallel-processing
、
gnu-parallel
、
ocrmypdf
我正在尝试使用一个名为
ocrmypdf
的包进行批处理。下面是一个可以处理1pdf文件的命令这里有一个命令,它可以处理我们运行它的目录中的所有pdf文件。parallel --tag -j 2
ocrmypdf
'{}' 'output/{}' ::: *.pdf 现在,我实际上想对目录中的所有pdf文件运行这个命令。这个需要多一个参数。
ocrmypdf
--sidecar txt/input.txt i
浏览 9
提问于2021-10-14
得票数 1
2
回答
例如
OCRMYPDF
模块
python
、
python-3.x
我已经读到了
ocrmypdf
模块,可以用来解决这个问题。但是,由于我的知识有限,我不知道如何编写代码。 我期望
输出
将扫描的pdf转换为可搜索的pdf。
浏览 0
提问于2019-08-08
得票数 4
1
回答
运行
OCRmyPDF
时出现的问题: WinError2和无效版本号
pdf
、
ocr
、
python-3.7
、
tesseract
、
python-tesseract
脚本组合到OCR,一个PDF:from tika import parserimport img2pdf
ocrmypdf
.ocr(pdf_file_path, '.pdf_file_path) return raw_pdf['content'
浏览 3
提问于2021-06-14
得票数 1
回答已采纳
2
回答
如何使用ocr脚本进行扫描
bash
、
shell-script
、
terminal
、
scanner
、
ocr
device "brother4:net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf)"
ocrmypdf
net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf > scan.pdf &&
ocrmypdf
或者可能是可能的--没有找到方法--将文件管道到
oc
浏览 0
提问于2023-04-26
得票数 0
1
回答
程序'tesseract‘无法执行或在您的系统路径上找不到- Laravel
python
、
laravel
、
pyinstaller
Traceback (most recent call last): File "
ocrmypdf
/subprocess/__init__.py",line
浏览 61
提问于2021-07-22
得票数 0
1
回答
在Windows Server 2016上安装
OCRmyPDF
-找不到liblept.dll。编辑路径安全吗?
python
、
windows
、
leptonica
我正在尝试使用Python37-32在我公司客户的Windows Server 2016Build 14393计算机上导入
ocrmypdf
。
Ocrmypdf
是Linux开发的Python3包。根据文档(),它不支持Windows。建议的解决方法是docker容器和Linux的Windows子系统。
ocrmypdf
仍然给出同样的错误。仔细阅读这一讨论,就会发现find_library在Windows上的操作方式不同。pip install
ocrmypdf
上述代码的预期结果
浏览 18
提问于2019-11-05
得票数 0
回答已采纳
1
回答
找不到源-pdf?
python
、
pdf
、
ocr
、
pdfplumber
、
ocrmypdf
我想用格拉姆普df将一些pdf文件从图片转换成可读的pdf-import
ocrmypdf
__name__ == '__main__':
ocrmypdf
.ocrFile "C:\Users\Polzi\Documents\DEV\
浏览 0
提问于2022-01-14
得票数 1
回答已采纳
1
回答
命令行有效,但使用output_type="pdf“时缺少文本层
ocrmypdf
最近,我从
ocrmypdf
9.0.3/tesseract 4.x升级到了
ocrmypdf
13.4.1/tesseract 5.1。当使用cremypdf9.x或13.x时,这在cli上起作用:但是,当我在应用程序中使用API时,
ocrmypdf
.ocr("path/to/inputfile.pd
浏览 2
提问于2022-03-25
得票数 0
1
回答
升级后,homebrew
ocrmypdf
出现致命的Python错误: config_get_locale_encoding:无法获取区域设置编码: nl_langinfo
python
、
homebrew
、
locale
自从我升级了homebrew (在macOS Catalina15.5上),
ocrmypdf
出现了一个奇怪的错误。我发出了
ocrmypdf
%
ocrmypdf
Fatal Python error: config_get_locale_encoding
浏览 80
提问于2020-07-14
得票数 1
1
回答
由于线程的原因,按钮回调只能工作一次
python-3.x
、
multithreading
、
tkinter
、
python-multithreading
(files[0], new_file, use_threads=True) elif len(files) > 1:for f in files:
浏览 19
提问于2020-10-18
得票数 2
回答已采纳
1
回答
AttributeError:“NoneType”对象没有属性“语言”
python-3.x
Traceback (most recent call last): File "
ocrmypdf
\api.py", line 340, in ocrAttributeError: 'NoneTypeimport
ocrmypdf
import ca
浏览 11
提问于2022-07-06
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机场新改扩建区域,多点定位系统无信号输出怎么办?
用代码输出一个独一无二的签名到底需要几步?
输出倒逼输入
输入,输出流(三)
【python】输出与输入
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券