腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Tesseract
tsv
输出
不工作
csv
、
tesseract
、
ubuntu-17.10
我正在尝试从Ubuntu17.10
中
的
命令行执行
tesseract
。我想要.
tsv
文件
中
的
输出
,因为我需要置信度。正如解释过
的
,我执行:但我得到了以下错误:
Tesseract
OpenSource OCR Engine v3.05.00
浏览 0
提问于2018-03-10
得票数 3
回答已采纳
1
回答
tesseract
中
的
TSV
和
TXT
输出
python
、
ocr
、
tesseract
我正在使用
tesseract
在Python
中
执行OCR。我想让
TSV
文件对置信度做一些分析,但也要用已读文本
的
文本文件。然而,获得这两个
输出
的
唯一方法是运行
tesseract
两次,这很耗时:
tesseract
input_image out_
tsv
-l eng
tsv
目前有没有一种方法可以在一次执行
中
创
浏览 4
提问于2018-07-26
得票数 4
1
回答
Tesseract
命令行界面:获得每个字符
的
识别可信度
tesseract
当使用
Tesseract
C API时,可以迭代识别的字符,获得它们
的
边界框和它们
的
识别可信度。我已经了解了如何使用
Tesseract
CLI获取边界框,它是通过在命令末尾添加makebox来完成
的
。问题是它不包含认可
的
信心。 有没有办法告诉
Tesseract
CLI也
输出
每个字符
的
信心?
浏览 6
提问于2017-06-20
得票数 1
1
回答
Java
中
的
象形文字或符号识别(Android)
java
、
android
、
neural-network
、
ocr
、
game-development
我正在制作一个Android游戏,它
的
核心机制是通过绘制以前指定
的
符号来“施法”。为此,我尝试了
Tesseract
,但它将胡言乱语识别为符号,并且(据我所知)没有任何方法来衡量与任何符号
的
相似性。我可以使用哪种神经网络/ocr实用程序来完成我
的
任务?
浏览 0
提问于2021-04-01
得票数 0
1
回答
从图像中提取文本- OCR
deep-learning
、
data-mining
、
cnn
、
image-recognition
、
ocr
我
的
形象是这样
的
:我想提取参数
和
对它们
的
值。有人能指导我怎么做吗?我知道,如果图像包含一些简单
的
文本,我们可以使用
tesseract
和
PIL库从图像中提取文本。在有多个参数
的
情况下,该怎么办?
浏览 0
提问于2019-06-08
得票数 1
1
回答
不支持
TSV
输出
。必需
的
Tesseract
>=3.05
python
、
python-3.x
、
tesseract
、
python-tesseract
、
pytesser
我对
tesseract
版本有意见。引发TSVNotSupported() pytesseract.pytesseract.TSVNotSupported:
TSV
输出
不支持。必需
的
Tesseract
>=3.05 如何安装
tesseract
3.05?
浏览 8
提问于2020-02-06
得票数 1
1
回答
将扫描
的
PDF表格转换为Excel
python
、
excel
、
pdf
、
ocr
我有一个扫描
的
PDF,其中有一些表格格式
的
随机数据,并希望将其复制到Excel工作表。 我试过使用数字PDF,使用'tabula‘来提取表格,但扫描
的
PDF需要OCR(我在google上看到
的
)。我知道涉及到OCR (
Tesseract
),但不知道我应该采取什么方法来解决这个问题。
浏览 7
提问于2019-06-20
得票数 0
1
回答
Pytesseract OCR边界框
python
、
ocr
、
python-tesseract
我正在尝试使用pytesseract在一个带标签
的
图像中进行ocr,标签返回一个带有相关边界框
的
xml。我想要匹配标签,看看它们是否与使用其边界框从整个图像
中
OCR
的
文本重叠。有没有办法获得每个完整单词
的
边界框?我试过下面的代码,但它返回每个字母
的
边界框,所以我想知道是否有人可以推荐一种替代方法,或者他们是否知道python
中
的
替代ocr包可以使用我
的
xml文件来查找边界框
和
其中
的
ocr (或者他们
浏览 5
提问于2019-01-13
得票数 0
4
回答
使用
Tesseract
进行页面布局分析?
c++
、
image-processing
、
ocr
、
tesseract
但是,我找不到任何关于如何使用该库
的
示例代码或文档。我希望这里有人能解释一下如何对图像进行布局分析,以及如何解析生成
的
数据。
浏览 5
提问于2011-11-14
得票数 13
回答已采纳
3
回答
如何在python或命令窗口中获取
Tesseract
置信度?
python
、
tesseract
如何在windows中使用
tesseract
3.05获得图像OCR后
的
置信度?我使用子进程命令从python调用
tesseract
: retcode = subprocess.call("
tesseract
-l eng myImage.png
txt
-psm 6" , stdin
浏览 2
提问于2016-05-05
得票数 3
回答已采纳
1
回答
如何编写bash脚本来对目录
中
的
所有文件运行相同
的
命令
18.04
、
bash
、
tesseract
我想对目录
中
的
所有文件运行这个命令。
tesseract
/home/kong/Documents/input/248.jpg stdout --psm 1 --oem 1 --dpi 300
tsv
>/home/kong/Documents/input/ocr_output/input/248.
tsv
输入
和
输出
应该有相同
的
数
浏览 0
提问于2019-07-31
得票数 2
回答已采纳
2
回答
如何从图像中提取特定文本
android
、
ocr
、
google-vision
从下图中,我想提取文本Arzt-Nr (654321161)下面的数字。我使用了以下代码,但文本没有按顺序排列。 String text = ""; TextBlock item = detectedItems.valueAt(i);
浏览 5
提问于2018-11-15
得票数 0
1
回答
Tesseract
多
输出
格式
ocr
、
tesseract
我
的
上下文我正在生成一个.
tsv
来检索提取
的
文本并在其上执行一些正则表达式,并生成一个.pdf以获得一个可搜索
的
pdf。我做这件事
的
方法是给
tesseract
打2次电话: 我所希望
的
我希望我
的
计算更快。我
的
想法是只调用一次
浏览 0
提问于2018-11-06
得票数 5
回答已采纳
1
回答
文件合并-同名,不同扩展名
files
、
cat
、
merge
如何将名称相同但扩展名不同
的
不同输入.
txt
和
.
tsv
文件合并到
输出
文件
中
?输入:file1.
txt
,file2.
txt
,file1.
tsv
,file2.
tsv
输出
:file1.merged,file2.merged
浏览 0
提问于2015-11-10
得票数 2
回答已采纳
1
回答
如何找到与特定点最接近
的
文本?
python
、
opencv
、
image-processing
、
ocr
、
python-tesseract
我有一个图像,带有最顶部坐标
和
最左侧坐标的标记点,我需要从该坐标找到相应
的
文本以获得该线
的
长度。 ? 我不允许使用原始图像,所以我尝试重新创建它。我需要得到蓝色坐标下
的
1700
和
红色坐标下
的
2777,才能找到每一条边
的
大小。现在我有了点
的
坐标,我正在考虑在那个点周围做一个ROI,并在那个ROI中找到文本,但我不知道怎么做。现在我得到
的
最外层
的
点是这样
的
: import cv2 import nu
浏览 18
提问于2019-09-17
得票数 2
回答已采纳
4
回答
如何从命令提示符测试同一文件夹
中
的
多个文件?
batch-file
、
cmd
、
ocr
、
command-prompt
、
tesseract
我知道如何在OS X上使用Terminal来测试同一目录
中
的
多个文件。for i in *.tif ; do
tesseract
$i outtext; done; 对于如何在运行Windows
的
计算机上通过命令提示符执行此操作,有人有什么建议吗?
浏览 2
提问于2015-07-28
得票数 9
2
回答
从文件
中
读取行,然后使用这些值搜索另一个文件
bash
、
csv
、
grep
、
cat
我有一个包含名称列表
的
文件(names.
txt
),还有一个包含数千行制表符分隔值(CallLog.
tsv
)
的
文件。我需要在names.
txt
中使用CallLog.
tsv
文件grep每个名称,然后将其另存为一个新文件。现在我正在逐个命名:然后,我将把所有的名字放到另一个文件
中
,并使用cat: cat "John" "Mi
浏览 0
提问于2013-07-31
得票数 3
回答已采纳
1
回答
如何获得ocr
输出
的
信任率?
python
、
ocr
、
tesseract
是否有一种方法可以获得由trust rate产生
的
OCR
输出
的
Pytesseract?我所说
的
信任率是OCR
输出
的
正确百分比。site-packages/pytesseract/pytesseract.py", line 232, in image_to_dataFileNotFoundError
浏览 0
提问于2018-02-18
得票数 4
1
回答
Python for OCR
中
的
图像预处理
python-3.x
、
ocr
我正在对python
中
的
OCR图像进行预处理。我把pdf转换成了二进制图像。我得到
的
输出
如下所示我希望
输出
结果是这样
的
你知道该怎么做吗?
浏览 2
提问于2017-03-14
得票数 0
1
回答
如何将终端
中
的
文本保存为各种文本格式?
terminal
、
tesseract
我正在玩一些OCR软件,特别是我花了一点时间在
tesseract
上。在Linux终端
中
,我把它放到可以加载图像并获得
tesseract
从图像中提取文本
的
位置。我现在正试图弄清楚如何从终端自动将被撕破
的
文本保存到pdf、odf、
txt
和
word格式。
浏览 0
提问于2021-03-08
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券