腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1061)
视频
沙龙
2
回答
如何修复在Apache Tika for Python中解析的
中文
PDF
以正确读取字符?
、
、
、
我有一个下载的
PDF
在中国,我想提取文本从使用提卡+ Python (原始链接到完整的
PDF
可以找到,或提取的样本页面可以找到)。当我运行以下代码时file_data = parser.from_fileÆ Éª £¬ £Ì £® £È £® 我创建
浏览 1
提问于2020-09-07
得票数 0
1
回答
基于Tesseract
OCR
的汉字
识别
、
、
、
我一直在使用Tesseract 3.0.2
OCR
SDK进行图像文本提取。但是,如果我使用
中文
文本图像并通过
OCR
,则Tesseract不会为我提供
中文字
符,而是我将获得数字和英
文字
符。但我需要在我使用的图像中显示的
中文字
符。 我如何才能做到这一点?有没有办法获得
中文字
符而不是其他字符?
浏览 7
提问于2013-05-16
得票数 16
回答已采纳
2
回答
汉字的C#光学字符
识别
、
、
我正在做一个
中文字
符的
OCR
项目。但问题是,我需要让用户使用方框中的光标来选择他们希望系统扫描和
识别
字符的图像部分。有人知道怎么做吗?我被要求做一些像COCR2这样的事情。
浏览 1
提问于2011-03-29
得票数 0
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
当我使用Windows 7中的扫描仪,并将扫描过的书籍页保存为
PDF
格式时,我可以打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我通过简单的扫描将页面扫描为文本,并将其保存为
PDF
格式。但是在Ubuntu中,当我打开扫描的
PDF
页面时,它会打开OK,但是我不能复制文本。
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
1
回答
使信的边缘变薄,使之只保留
OCR
的信的中心
、
、
、
我正在努力提高复杂字母的
识别
率,例如日文/
中文字
母。
浏览 4
提问于2016-11-29
得票数 1
回答已采纳
2
回答
可将
OCR
文本插入回源
PDF
的
OCR
库
、
是否有库(或可执行文件)可以
OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
2
回答
哪种软件可用于
PDF
扫描,可以提取信息并发送到发票程序?
、
、
、
、
我在一家公司当实习生,他们需要精确扫描
PDF
格式的发票。该程序,即java库,需要能够提取发票的某些部分,这样用户就不必手动重新键入信息。
浏览 0
提问于2019-09-12
得票数 0
1
回答
快速检查
PDF
文件上的
OCR
文本层
、
有没有什么程序可以让我在
PDF
渲染的基础上叠加
PDF
的文本(
OCR
)层?如果这可以用程序来完成,那会更方便,如果不能,一些cli命令或脚本也可以工作。
浏览 2
提问于2017-11-18
得票数 1
1
回答
哪种
中文字
体是中国人民的
PDF
阅读器普遍支持的?
、
我正在生成
PDF
文件,其中包含英文和
中文字
符(使用Ruby对虾库)。我不想在生成的
PDF
文件中嵌入
中文字
体文件,因为这些文件需要保持较小。所以,我想知道我是否可以在
PDF
文件中提到一个
中文字
体名,让
PDF
阅读器正确地呈现汉字,因为
PDF
阅读器已经有了
中文字
体文件。 这有道理吗?如果是这样的话,在大多数中国人使用的
PDF
阅读器中是否会安装一些常用的
中文字
体?
浏览 2
提问于2015-05-06
得票数 2
回答已采纳
1
回答
关于拆分
PDF
和
OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和
OCR
库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给
OCR
,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
3
回答
日本最精确的开源
OCR
?
、
、
根据您的经验,什么是最准确的开放源码光学字符
识别
(
OCR
)库/软件来读取日文文本?日本旧手机(特别是夏普手机)在10年前就有了很好的日本
OCR
,所以我想它在开源中也是可行的。
浏览 0
提问于2015-02-03
得票数 6
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的文本。 所有都是一样的,
浏览 1
提问于2019-03-07
得票数 0
1
回答
如何在PDFTextExtractor上使用iTextSharp
我想用iTextSharp从
pdf
文件中检索文本。但是,我无法像在itextsharp(itext)的JAVA中那样使用PDFTextExtractor。私有字符串readPDFOffline(string fileUri);检索此
Pdf
的文本内容;*返回contentOfflineFile
浏览 3
提问于2010-12-10
得票数 3
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如何让转换笔记本命令在Mac上支持
中文
?我愿意为jupyter notebook贡献一些代码。
、
此命令成功地将不包含
中文字
符的笔记本文件转换为
pdf
。jupyter nbconvert test.ipynb --to
pdf
有没有办法解决这个问题?
浏览 3
提问于2019-11-14
得票数 2
1
回答
OCR
表格
识别
是否支持Excel表格合并?
浏览 138
提问于2022-06-15
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.exe -f MAC
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
OCR
文字
识别
?
浏览 146
提问于2022-06-15
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
2
回答
生成包含
中文字
符的iText,但不显示
、
、
、
我正在使用iText创建一个带有
中文字
符的
PDF
。Font.NORMAL));FontFactory.getFont("MS Mincho", 16, Font.NORMAL) 但是,生成的
PDF
仅显示ASCII文本“亚洲字符”,即
中文字
符不显示在
PDF
上。你知道为什么生成的
PDF
中缺少
中文字
符吗?
浏览 0
提问于2013-05-30
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
OCR-文字识别
OCR文字识别工具
手写OCR文字在线识别
图片怎么识别成文字?用ocr文字识别软件!
在线Ai免费文字识别 OCR
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券