腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何在将文档从
PDF
转换为
文本
时处理unicode字符编码问题
、
、
、
、
我正在尝试从
PDF
中提取
文本
。
PDF
包含印地语(Unicode)
文本
。我使用的提取实用程序是Apache PDFBox ( )。提取器提取
文本
,但
文本
无法
识别
。我尝试了在多种编码和字体之间切换,但仍然
无法
识别
预期的
文本
。下面是一个例子:假设
PDF
中的
文本
是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索
文本
?
、
、
我试图在
PDF
文件中找到一些
文本
,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有
文本
,而其他
PDF
是
文本
和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
Android:如何测试显示在WebView中的
pdf
、
、
在安卓系统中,我想测试包含条款和条件的
PDF
文件,但是这个文件显示在WebView中。我可以切换到WebView,我使用下面的代码。
浏览 4
提问于2022-11-09
得票数 -1
1
回答
如何在蟒蛇的景观方向上阅读
pdf
?
、
、
、
我有一个
pdf
文件,是在肖像方向,但在一些页面,
文本
是在景观方向。当使用PyPDF2读取上面的页面时,我从extractText()函数获得以下
文本
:Out24:"U ~ 00 w.T.-O.O.O.mó00 woNN p 00 a+ -fl n~n a O ;~ 0 ~^ o a. ~… 下面是我试图提取
文本
的页面示例:
浏览 1
提问于2018-04-03
得票数 0
回答已采纳
1
回答
禁用com.itextpdf.text.Paragraph链接
、
、
、
、
问题如下,我有一个创建
pdf
的方法,但当我添加一个包含链接的
文本
并创建
pdf
文件时,它允许我点击链接,为了安全起见,它不能有链接。PdfReader reader = new PdfReader(new FileInputStream(new File("D:\\ruta\\\\basepdf.
pdf
"))); String p=java.util.Base64.getEncoder().encodeToString(baos.toByteAr
浏览 17
提问于2019-10-24
得票数 0
回答已采纳
1
回答
Azure Language Studio没有显示有关OCR的python脚本中的
文本
内容
、
、
我正在研究word文档的OCR,以
识别
文档中提到的内容。我注意到OCR生成的python代码没有在语言工作室中自动生成python脚本中显示文档中可用的内容。我只想得到python脚本结构,在那里我可以看到标记,这些标记专注于
识别
没有表内容的句子。 我要找的方法对不对?任何解释需求的流程都是非常感谢的。
浏览 14
提问于2022-06-15
得票数 -1
回答已采纳
1
回答
用c#编程编辑
PDF
(非固定
PDF
)
、
、
、
、
是否可以编辑在C#中不可填充的
PDF
格式 所需经费: 必须编辑以编程方式填写的表格中的
文本
和数据
浏览 6
提问于2012-06-28
得票数 1
2
回答
扫描图像/
PDF
到可搜索图像/
PDF
、
谁能建议我如何将扫描的图像转换为可搜索的图像或将扫描的
pdf
转换为可搜索的
pdf
?我在ubuntu中尝试过pdfocr应用程序,但没有成功。
浏览 4
提问于2014-07-20
得票数 3
1
回答
用于Windows的
PDF
文件和图像(OCR)
文本
识别
应用程序
、
、
、
问题:
PDF
文件和扫描文件中的图像包含
无法
复制或编辑的
文本
。但是,由于文档的大小和所涉及的大量时间,手工打字是不可能的。重量轻,使用简单
文本
可以保存在新的可编辑
PDF
或RTF文档中。 开源或高级版
浏览 0
提问于2019-12-05
得票数 1
2
回答
Tesseract OCR混淆了0到8的斜线
、
、
我曾在终端字体上训练过tesseract,但无论如何,我都
无法
让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?
浏览 8
提问于2018-10-31
得票数 22
1
回答
如何在
pdf
文件中搜索
文本
?
我运行的是ubuntu 22.0.4我试过evince,但它找不到我尝试过的
文本
,但是它找不到我尝试过的pdfgrep
文本
,但是它找不到
文本
浏览 0
提问于2023-04-14
得票数 -1
1
回答
FPDF:没有正确输出俄文
文本
、
、
在我的PHP项目中,我有一个
PDF
,我想输出俄语
文本
:Я дейÑтвую Ñкорее доверительно Ð$
pdf
->SetTitle('My Ti
浏览 1
提问于2016-01-23
得票数 0
1
回答
PDF
到
文本
文件的转换
、
我在一个主文件夹中有3000个子文件夹,每个主文件夹中包含2个
pdf
。我写了下面的代码来转换
文本
文件中的
PDF
。Files (x86)\\xpdfbin-win-3.03\\bin64\\pdftotext.exe"', paste0('"', x, '"')), wait = FALSE))})* 但是有一些
PDF
是不能转换成
文本
的,如何将它们放在一个列表中。
浏览 0
提问于2017-10-09
得票数 0
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的
文本
?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的
文本
。 我试着测试更多的文件格式:
浏览 1
提问于2019-03-07
得票数 0
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档
文本
吗?比如找到和替换特定的
文本
?我能够编辑特定坐标(x,y)的
pdf
,但
无法
识别
和替换。我看到的所有库都是从零开始创建的
PDF
和小的编辑功能。不管怎样,我可以用itext编辑上面的解释吗?请advise...thank你! **例子:一份
pdf
文件载有以下的副翼。在这一段中,我需
浏览 5
提问于2014-07-10
得票数 2
2
回答
从
PDF
中提取
文本
并将其插入到另一个
PDF
中
、
、
我们有一个里面有
文本
的
PDF
,我需要把这个
文本
放到另一个页面的末尾。我们遇到的问题是,
PDF
1中有一些字符
无法
复制,因为它们不是可
识别
的字符,将它们转换为小方框。我试着把
pdf
格式转换成图片,然后用这种方式插入,我试着从原始
pdf
文件中提取
文本
并插入,但是在不下载第三方库的情况下找不到这样做的方法,我已经开始尝试把
pdf
格式插入到
pdf
中了。我
无法
下载任何第三方库。
浏览 0
提问于2018-02-07
得票数 0
1
回答
向Windows 7添加一种语言
、
我一直有一个
PDF
和一些
文本
无法
识别
的问题。语言是缅甸语,我有Windows7企业版。我需要将它添加到我的计算机中,这样我的视觉工作室才能
识别
它,我可以将
文本
插入到
PDF
中。 我在哪里可以找到下载的语言包?如果它在我的计算机上,并且我将它推送到我们的测试环境中,它会在它不再在我的计算机上时中断,还是它已经在编译中阻止了
文本
的中断?
浏览 0
提问于2018-03-06
得票数 0
1
回答
使用c#
识别
从
pdf
文档中提取的
文本
的段落和页面边界
我正在开发应用程序,我需要从
pdf
中
识别
段落。是否有任何方法提取
文本
和
识别
段落和页面边界提取的
文本
从
pdf
文档使用c#?
浏览 2
提问于2015-03-25
得票数 3
回答已采纳
1
回答
从控制器弹簧引导在浏览器中预览
pdf
:
无法
识别
的响应类型;以
文本
形式显示内容
、
、
、
、
我想预览一个用java生成的
pdf
文件,但是下面的代码给出了这个错误 HttpHeaders headers = new HttpH
浏览 8
提问于2022-03-27
得票数 3
回答已采纳
2
回答
如何解析
pdf
文件中的表?
、
、
如何使用syncfusion解析
pdf
文件中的表?
浏览 0
提问于2017-01-25
得票数 2
点击加载更多
相关
资讯
olmOCR:高效 PDF 转文本工具,支持表格与手写识别
PDF文件如何迅速转成TXT文本?
如何给Pdf文本添加图形标注
PDF文字识别软件哪个好?试试这些PDF识别软件吧
如何为PDF文件添加文本框?PDF编辑小妙招!
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券