腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
pdf
、
search
、
text
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从
扫描
页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
ZXing
PDF
417 + ALL_CODE_TYPES
android
、
zxing
、
pdf417
使用ZXing (在安卓上),如果你启动像这样的
PDF
417条形码
扫描
.List<String> oDesiredFormats = Arrays.asList("
PDF
_417".split(",")); IntentIntegrator integrator = new你启动一个“所有代码”(除了
PDF
417和其他几个)条形码
扫描
像这样.那么,如何启动一次条形码
扫描
,同时
识别
(所有标准代码和
PDF
浏览 5
提问于2014-03-21
得票数 2
回答已采纳
1
回答
如何使用python
识别
pdf
中的图形?
pdf
、
text-parsing
、
pdf-parsing
、
pdfplumber
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
2
回答
可将OCR文本插入回源
PDF
的OCR库
pdf
、
ocr
是否有库(或可执行文件)可以OCR
PDF
(通常是通过
扫描
纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是
扫描
图像背后的隐形文字。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
0
回答
.net的tesseract OCR能处理
pdf
文件吗?
c#
、
pdf
、
ocr
、
tesseract
我想在png和
pdf
文件上执行光符
识别
。我能够获得png文件的Tesseract 3.0.2 .net包装器工作,但我找不到任何用于
PDf
files.So的类,它是否适用于
pdf
files.If不然后请让我知道
扫描
pdf
的任何其他开源库。我的需求是
扫描
特定圆的
pdf
格式的图表,并为这些圆创建超链接。
浏览 8
提问于2016-12-27
得票数 2
回答已采纳
1
回答
使用从
扫描
PDF
批量生成的OCR创建可搜索的
PDF
文件
pdf
、
ocr
其目标是自动将所有
扫描
文档转换为可搜索的
PDF
文件,而不仅仅是图像。
扫描
后的文档由
扫描
仪自动上传到Linux服务器上的共享文件中,作为
PDF
文件。该软件应该能够监视文件夹和自动OCR
扫描
的文件,并将
识别
的文本添加到
PDF
文件,使其可搜索。它还应该能够很好地处理多页
PDF
。Linux 在后台自动工作,不需要任何额外的手动步骤。能够以正确的方式将OCRed文本添加回
PDF
中(这样桌面搜索引擎就可以对其进行索引)
浏览 0
提问于2014-04-28
得票数 16
2
回答
使用Google Cloud Vision的OCR
PDF
文件?
pdf
、
pdf-generation
、
ocr
、
google-cloud-vision
目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing
扫描
的
PDF
文件的后端?如果没有,如何使用Google Cloud Vision将
PDF
转换为OCRed
PDF
?据我所知,Cloud Vision目前支持
PDF
文件,但它只能将
识别
的文本输出为JSON文件。因此,似乎需要在Google Cloud Vision之外的另一个步骤中,将这个转换后的文本放在
PDF
中的图像顶部。我经常需要将
扫描
的文档转换为包含OC
浏览 0
提问于2018-09-15
得票数 4
1
回答
如何创建高保真度
PDF
与可复制文本
扫描
?
pdf
、
scanner
、
text
、
ocr
一些公司通过
扫描
仪提供Windows软件,这些软件可以从
扫描
过的页面上创建
PDF
,这些页面看起来与
扫描
的内容完全一样(就好像它只是全页图像),但文本是可以
识别
和复制的。如何在Ubuntu上创建这样的
PDF
? 请注意,我不希望将
扫描
文本转换为常规文本。我想保持
PDF
外观的图片-完美的原始页面,但增加了一个公认的文本层,以方便使用。我有一个工作的高分辨率
扫描
仪,我使用的XSane目前.它
扫描
页面精细,并创建美丽,高新闻部
浏览 0
提问于2017-09-24
得票数 4
回答已采纳
1
回答
寻找收据
扫描
器,而不是连续
扫描
任何长度的收据。
scanner
我正在寻找一个收据
扫描
仪,可以
扫描
非常长的收据(高达30英尺长),并产生一个单一的图像或
PDF
。理想情况下,它将具有光学字符
识别
(optical字符
识别
),并生成一个包含文本信息的
PDF
(例如,当您在Acrobat之类的地方打开
PDF
时,您可以搜索单词,或者可以使用单独的软件将文本内容提取到一个
浏览 0
提问于2018-05-09
得票数 2
1
回答
如何快速从图像中
扫描
可搜索的
pdf
?
ios
、
swift
、
pdf
、
ocr
、
swift5
我想
扫描
文件与tesseract框架中的迅速和生成
pdf
文件,可以搜索。 实际上,我使用此代码将图像转换为文本,但我希望生成主格式的图片,但格式将随着转换为文本而改变,并生成
pdf
文件。
浏览 2
提问于2020-10-13
得票数 0
回答已采纳
1
回答
如何在
PDF
417 10.2上使用xamarin forms + zxing
扫描
驾照( iOS )
c#
、
xamarin
、
xamarin.ios
、
barcode
、
zxing
我使用Xamarin表单来编写iOS应用程序,并使用ZXing库
扫描
条形码。我试图读取一个驾驶执照(
PDF
417)条形码,但图书馆无法
识别
该条形码。如果我在PossibleFormats中包括UPC或其他条形码,它们将被正确
扫描
。 我也确信我试图读取的条形码是
PDF
417条形码,因为Scandit能够正确
识别
它,而只使用
PDF
417条形码。,我需要更改什么才能正确
识别
PDF
417条形码?options.PossibleFormats
浏览 6
提问于2017-03-07
得票数 3
回答已采纳
1
回答
我的
扫描
器的IP地址是多少?
scanner
、
sane
、
ip-address
、
xsane
我试图配置和我的
扫描
仪与SANE和一些
PDF
软件,我正在试用.但它需要我的本地(USB)-connected
扫描
仪的IP地址(嗯,多功能)。
识别
这些信息的命令是什么?
浏览 0
提问于2014-04-18
得票数 0
回答已采纳
1
回答
高亮注释没有突出显示我想要的行
18.04
我使用的是Ubuntu18.04.4LTS,我尝试使用文档查看器,当我尝试使用突出显示注释时,它会高亮显示下面和左边的行,我想知道是否有一种方法来修复这个问题,或者用我想要突出显示的内容来更精确地显示方法。
浏览 0
提问于2020-08-12
得票数 0
1
回答
PyPDF2从
扫描
的
pdf
中提取垂直文本
python
、
python-3.x
、
pypdf2
、
pdfminer
、
pdf-extraction
我正在尝试提取文本从
扫描
的
pdf
使用PyPDF2。有些
pdf
包含垂直排列的文本。但页面的方向是肖像。是否有任何方法可以
识别
文本是否垂直对齐并使用pdfminer或PyPDF2读取
PDF
中的垂直行?
浏览 1
提问于2018-09-27
得票数 6
1
回答
Howto:使用C#在光学字符
识别
前提高
PDF
质量
c#
、
pdf
、
ocr
、
readable
我正在创建一个服务,用于监视文件夹中的
扫描
文件。一旦文件存在,该服务就会提取它,并将其转换为可读的
PDF
。在此过程中,该服务还会搜索条形码。现在,对于光学字符
识别
,我们使用了Atalasoft的SDK ()。此外,条形码
识别
器也包含在此SDK中。我测试了Kofax ()。我正在寻找类似的东西,但这可以使用某种SDK-kit在服务中实现。
浏览 2
提问于2011-07-06
得票数 5
回答已采纳
1
回答
用于
识别
ocr文本的Adobe acrobat 8命令行开关
pdf
、
adobe
、
ocr
、
acrobat
、
scanning
我想使用命令行,以执行许可的adobe acrobat 8来
识别
OCR文本已经
扫描
的
pdf
文件,并使其完全可搜索的
pdf
?提前感谢!
浏览 3
提问于2010-04-09
得票数 0
1
回答
扫描
PDF
文档和图像的搜索工具
pdf
、
search
、
text-search
我正在寻找一个工具,可以搜索
扫描
PDF
文档和图像中的文本。我试过Evernote,我真的很喜欢它,但是我不想在别人的云上有个人文档。我是一个开发人员,所以我可以自己做一些小事情,但解析
PDF
文件的文本是远远超出我的范围。无云服务应该能够可靠地处理多达100,000份文件。
浏览 0
提问于2017-05-23
得票数 2
回答已采纳
1
回答
我想从OCR数据中提取表信息。
python
、
image
、
ocr
、
pytesser
我想从OCR数据中提取表格信息,我有原始文本和它的文本。我试过pytesseract,但找不到实际的实现。我试过这个:我希望从OCR数据中获得此表的表格结构,以供进一步处理。
浏览 3
提问于2019-01-20
得票数 0
10
回答
光学字符
识别
软件推荐?
software-recommendation
我看到一些电子书/论文显然是从他们的纸质版本中
扫描
出来的,但电子图书/论文中的文本却能惊人地被复制出来。我想直接
扫描
的版本一定是由一些光学字符
识别
软件处理的。所以我想知道什么是推荐的光学字符
识别
软件?尤其是那些要么是Ubuntu的,要么是免费的?如果那些在Windows上要好得多,请告诉我。我特别感兴趣的那些OCR,可以接受一个
扫描
的
pdf
文件作为输入,但仍然产生作为输出的另一个
pdf
文件看起来与输入一个,但其文本可复制。请每个答案限
浏览 0
提问于2010-10-22
得票数 15
回答已采纳
3
回答
如何区分数字创建的
PDF
和可搜索的
PDF
?
python
、
pdf
我目前正在分析一组
PDF
文件。我想知道有多少
PDF
文件属于这三个类别: 可搜索
PDF
:
扫描
文档这是很容易
识别
图像仅
PDF
在我的领域,因为每个
PDF
包含文本。如果我不能提取任何文本,它只是图像。但我怎么知道它是“只是”可搜索的
PDF
,还是数字创建的
PDF</
浏览 11
提问于2020-08-19
得票数 11
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
发票扫描识别/发票信息扫描识别系统
扫描文件怎么扫描成pdf?图片转pdf的技巧
文字识别扫描,如何文字识别扫描出来?
免费文字识别扫描,有什么免费文字识别扫描
文字识别/图片识别/图片扫描
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券