腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
用Microsoft.media.ocr制作带有包围框覆盖的实时摄像头,这样用户就可以在UWP
中
触摸和使用
文本
到语音?
windows
、
uwp
、
ocr
我已经实现了实时摄像头和使用Android
文本
识别,当我触摸边界框覆盖,
文本
到语音作品,但在通用窗口,应用程序无法获得任何文档,谁能帮助
如何
实现在实时相机OCR?
浏览 0
提问于2018-04-16
得票数 0
回答已采纳
1
回答
我们可以使用Selenium
从
图像
中
获取
文本
吗?
selenium-webdriver
、
testng
、
page-objects
、
eclipse
这是
图像
的路径,为了安全起见,我必须将显示在
图像
上的
文本
输入到
文本
中
, private WebElement textShown; 这是XPath,我在这里填充
图像
上显示的
文本</em
浏览 0
提问于2023-03-05
得票数 -1
回答已采纳
1
回答
如何
从
PDF中
提取
文本
,包括
图像
和
文本
python
、
nlp
、
text-mining
、
text-extraction
我要从多个PDF文件中
提取
文本
。PDF文件包括
文本
和一些
图像
,甚至一些页面是扫描的页面(我假设扫描的页面就像
图像
)。我按照下面的命令
从
PDF文件中
提取
文本
。我的问题是,
如何
使用条件编辑命令,以检查每个页面是否包含任何
图像
,然后
从
图像
中
提取
文本
。如果你能帮助我,我将不胜感激。
浏览 10
提问于2021-10-14
得票数 0
1
回答
无法
从
特定PDF中
提取
文本
和
图像
ruby
、
pdf
、
command-line
、
ubuntu-14.04
、
pdfbox
有谁能让我知道
如何
从
PDF中
提取
所有
文本
和
图像
?在类似的场景
中
,我能够
提取
图像
,我使用Google创建了一个PDF,只有几行
文本
和2个png
图像
。但是,我无法
从
样本中
提取
图像
。我试过以下几点:1)“pdf阅读器”创业板,它只支持少数格式的
图像
提取
。 2)“文档分割”创业板,它只能
提取<
浏览 0
提问于2015-05-20
得票数 2
回答已采纳
1
回答
如何
打开选项以将标准化
图像
存储到我的知识库
azure-cognitive-search
文档- -表示“当imageAction被设置为非"none”的值时,新的normalized_images字段将包含一个
图像
数组“。
如何
从
门户网站执行此操作?我单击索引器的“高级选项”,在“要
提取
的数据”下拉列表中看到的唯一选项是:“内容和元数据”、“所有元数据”和“仅存储元数据”。不用说,"normalized_images“字段当前不在我的投影对象
中
。
浏览 2
提问于2019-11-03
得票数 0
1
回答
如何
区分PHP
中
的“
文本
”PDF和“
图像
”PDF?
php
、
pdf
、
tesseract
、
ghostscript
、
xpdf
我最近建立了一个Linux服务器,可以使用Xpdf的一部分pdftotext命令将基于
文本
的Xpdf转换为
文本
,还可以使用gs (Ghostscript)和tesseract命令的组合将基于
图像
的Xpdf转换为
文本
。当我已经知道PDF是基于
文本
还是基于
图像
时,这两种解决方案都能很好地工作。但是,为了自动化将许多PDF转换为
文本
的过程,我需要能够判断PDF是基于
文本
的还是基于
图像
的,这样我就知道在PDF上运行哪一组进程。在PHP中有没有
浏览 5
提问于2016-09-23
得票数 1
回答已采纳
3
回答
如何
识别场景
图像
的
文本
c#
、
image-processing
、
ocr
我正在尝试构建一个系统(使用C#),可以识别场景
图像
的
文本
。我看到场景
文本
识别是一项具有挑战性的任务,因为低分辨率,复杂的背景,不均匀的闪电或模糊效果…… 任何解决这个问题的想法都将不胜感激。
浏览 0
提问于2012-01-08
得票数 0
3
回答
计算机视觉
computer-vision
、
text-extraction
我试图
从
视频帧和
图像
中
提取
文本
。github中提供的大多数代码都与python <3版本兼容。任何关于
如何
进行和获取相关代码和好文件的想法。
浏览 8
提问于2018-05-28
得票数 1
回答已采纳
2
回答
来自不同文件类型的
文本
提取
库,PDF,DOC,DOCX,TXT c#
c#
、
text
、
information-retrieval
我正在构建以多文件格式搜索
文本
的信息检索系统,我已经尝试过EPocalipse IFilter Lirary,但是在尝试读取docx文件时通过了一个异常,并且我尝试了Toxy Library --尽管这是
浏览 5
提问于2016-07-03
得票数 5
回答已采纳
1
回答
azure计算机视觉检测
文本
azure
我正在使用azure计算机视觉
从
图像
中
提取
文本
,它按预期工作,但现在我面临着一个挑战,我必须
从
图像
中
检索特定的
文本
,而不是
从
图像
中
检索所有
文本
,并且我想要
提取
的
文本
可能在不同的
图像
中
不同。(也许这些
图像
可以有一个共同的
文本
) Azure计算机视觉有什么方法可以帮助我做到这一点
浏览 67
提问于2021-11-19
得票数 1
回答已采纳
1
回答
如何
对
中
较大句子的一部分块进行分组?
ocr
、
google-cloud-vision
我正在使用Google Cloud Vision API on Python来检测囤积板
中
通常在商店/商店上面发现的
文本
值。到目前为止,我已经能够检测到单个单词及其包围多边形的坐标。
浏览 1
提问于2018-09-18
得票数 0
回答已采纳
1
回答
如何
使用pdfbox获得pdf的最大fontsize
object
、
font-size
、
pdfbox
、
pdf-extraction
我使用pdfbox
从
pdf中
提取
一些信息,但是
如何
提取
每个对象的信息?如果其中一个包含流,我
如何
解码该流以显示? 我能从一个pdf框
中
得到最大字体大小的吗?
浏览 8
提问于2015-03-23
得票数 1
1
回答
OCR识别奇怪的字符。为什么?
character
、
ocr
,wlñzf . 94' kzl 5. vsmNs/.caelumcombr 在搜索
中
,我配置了这个:baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
浏览 1
提问于2012-11-22
得票数 1
1
回答
从
图像
中
获取手写
文本
java
、
image
、
ocr
、
eclipse-mars
如何
在Java
中
从
图像
中
提取
手写
文本
,如银行表单
图像
?我尝试使用Tesseract,OCR,GOCR,但对我不起作用。在Java
中
,有没有其他方法可以
从
图像
中
提取
手写
文本
,其工作效率至少为80-90%?
浏览 17
提问于2017-05-30
得票数 1
1
回答
提取
PDF中表示为
图像
的
文本
- itextsharp
c#
、
pdf
、
itextsharp
、
itext
我在使用ITextSharp
从
PDF文件中
提取
文本
的过程
中
,我已经成功地
提取
了我感兴趣的
文本
的一部分,但当我继续我的‘
文本
’
提取
时,我注意到一些
文本
单词(当我使用itextsharp
从
整个页面
提取
整个
文本
时无法获得
文本
)实际上被表示为
图像
。因此,简而言之:
如何
提取
包含在PDF
图像
对象
中
浏览 4
提问于2013-06-07
得票数 2
回答已采纳
3
回答
如何
使用任何Java库使现有的PDF
文本
可搜索?用OCR
java
、
ocr
、
pdfbox
如何
使用任何java库生成可搜索的
文本
?开源或付费。
如何
使用PDFBox将OCR应用于pdf?
如何
使pdf
文本
可编程搜索使用pdfbox,我搜索了很多。没有找到任何解决办法。
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
1
回答
如何
在OpenCV - JAVA
中
设置感兴趣区域
java
、
opencv
、
ocr
、
tesseract
我有一张名片的
图像
,为了
从
图像
中
仅
提取
名片,我对其执行了透视变换。现在,我希望将此
图像
提供给tesseract-ocr引擎。在此之前,我希望
提取
包含一些
文本
的感兴趣区域,并提供该区域,而不是整个
图像
。
如何
从
卡片中仅
提取
文本
。 以下是该
图像
的示例:
浏览 1
提问于2014-11-08
得票数 1
1
回答
如何
通过Firebase ML套件
文本
识别扫描七段显示器?
flutter
、
dart
、
ocr
、
firebase-mlkit
、
text-recognition
Firebase Ml工具包
中
的
文本
识别API不能识别我试图
从
称重计扫描出来的数字或七段显示数字,有没有办法解决这个问题?我尝试了flutter应用程序的firebase ml vision的Dart包,并使用了firebaseVisionImage类、
文本
识别器类和visionText类,如下所示。
浏览 2
提问于2019-07-05
得票数 1
1
回答
波斯文件的PDFBOX
java
、
pdf
、
pdfbox
、
arabic
、
persian
我想使用pdfBox
从
波斯语pdf文件中
提取
测试,但是它返回所有波斯字符的"?" (它正确地返回同一文档
中
的拉丁单词)。 我怎么才能修好它?有什么建议吗?
浏览 3
提问于2018-08-29
得票数 3
1
回答
图像
到
文本
转换python
python-3.x
、
ocr
、
python-tesseract
我正在尝试使用python
中
的pytesseract模块
从
图像
中
仅
提取
突出显示的
文本
。 问题是我无法
提取
突出显示的部分,整个
图像
正在转换为
文本
,我不知道
如何
提取
基于背景颜色的特定部分。
浏览 11
提问于2020-05-12
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券