腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4263)
视频
沙龙
1
回答
在
PDF
上使用包含文本的文档
AI
仍然包括文本错误
、
使用文档
AI
处理器从
PDF
(英语、德语、意大利语)中提取文本非常好,但有时
OCR
不匹配。特别是在“单词”不是字典中的单词,而是包含字母和数字的部分数字有问题的情况下(主要是O0L1-5S)。有没有办法告诉文档
AI
使用
PDF
中包含的文本(作为文本)。对于我的知识文档,
AI
使用
PDF
页面的图像来对内容进行
ocr
。 是否有任何标志可自定义文档
AI
以使用文本版本或任何其他想法?我需要使用文档
AI
,因为我希望以正确的方式提取
浏览 2
提问于2021-07-05
得票数 0
1
回答
是否有方法将文件
AI
OCR
响应解析为
pdf
格式?
我将扫描的
PDF
文件传递到Google文档
AI
OCR
中。JSON响应(或者在使用Python时返回的文档对象)以结构化格式包含
PDF
的内容,正如所描述的。我也希望能够输出一个
PDF
文件(或者XML,如果更简单的话)。有这样的功能吗?任何关于可能的实现的提示都是非常感谢的。注意:在我执行任务之前,
PDF
已经是另一个工具的OCRed了,但是质量不如文件
AI
OCR
那么好。 谢谢
浏览 1
提问于2021-04-07
得票数 0
回答已采纳
2
回答
从
PDF
中提取文本,并将提取的文本保存在Excel或其他地方
、
我想要一个简单的方法,从
pdf
中提取文本,并将文本保存到Excel中。 谢谢!
浏览 16
提问于2020-07-13
得票数 0
2
回答
我们如何在QnA制造者中显示一个
pdf
作为一个问题的答案?
我有
PDF
文档,它有很多截图和非常少的文本。当用户询问特定的问题时,我如何直接显示
PDF
本身。
浏览 2
提问于2020-09-21
得票数 0
回答已采纳
2
回答
为什么我用魔杖从
pdf
中提取图像jpg,它会在文本上变成黑色背景?
、
、
、
、
我对一些
pdf
文件有问题。我需要将它们转换为jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在word转换为
pdf
文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?原页
pdf
? 已将
pdf
转换为jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
1
回答
在
PDF
文件中查找文本消息的工具
、
、
、
目标: 文本消息是
PDF
文件中的图片。你需要什么工具来使用我订购的工具? 不管它付不付服务费。您只需要发送一个
PDF
文件和短信,然后检索答案,如果有匹配和结果是什么。
浏览 0
提问于2018-08-18
得票数 1
1
回答
在
PDF
中用python执行
OCR
有可能吗?
、
、
、
在
PDF
中用python执行
OCR
有可能吗?我正在尝试构建一个程序,从每一个
PDF
表格中提取一些信息,比如Autodesk BIM360所做的事情。
浏览 6
提问于2022-05-26
得票数 -2
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
3
回答
PDF
转
Word?
浏览 359
提问于2018-06-03
1
回答
api.
ai
.qq.com这个域名解析不了, 请问是下架了还是什么原因?
、
、
、
浏览 201
提问于2022-07-25
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
图像保留结构中的翻译语言
、
、
我们希望将
pdf
文档中的图像从不同的语言转换为英语。它们是扫描过的图像,很多时候都有表格或一些结构。我们希望翻译成英语,但尽可能保留文档的结构。因此,仅仅基于纯文本的翻译是不够的。
浏览 6
提问于2021-07-21
得票数 0
1
回答
在修改和部署更新之后,查询非常缓慢。
查询 SELECT dv.id,dv.client_id,b.name block_name,dv.is_
ocr
_pending,dv.time,dv.label,dv.is_
pdf
_broken,dv.is_
pdf
_scan,dv.
ocr
_recall_id,dv.
ocr
_vatno,cv.name
ocr
_vatno_name,dv.
ocr
_vatno_country,dv.
ocr
_is_vatno_verified,dv.
ocr
浏览 0
提问于2019-01-06
得票数 0
回答已采纳
1
回答
Google平台-使用自定义数据格式的顶点
AI
培训
、
、
我需要训练一个自定义的
OCR
在顶点
AI
。我的数据有裁剪图像的文件夹,每个图像都是一行,csv文件有2列:图像名和图像中的文本。但是当我试图将它导入到顶点
AI
的中时,我发现图像数据集只支持分类、分割和目标检测。我可以使用顶点
AI
进行训练,如何做到这一点?
浏览 9
提问于2022-04-20
得票数 1
回答已采纳
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
图片转pdf怎么转?图片转pdf软件推荐!
pdf怎么转cad,pdf转cad技巧
PDF转HTML怎么转?pdf转html格式其实很简单
PPT转PDF怎么转?这个工具帮你完成PPT转PDF!
PDF转图片怎么清晰保存?教你PDF转图片怎么转
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券