pdf文件如何识别文字_pdf文件文字识别_识别pdf文件文字 - 腾讯云开发者社区

、、

我有很多文件夹与很多PDF，我想要光学字符识别那些没有文字层。所以首先，我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作，但我迷路了。如何找到没有文本的PDF？

浏览 0提问于2021-01-15得票数 5

回答已采纳

2回答

Acrobat XI Pro喜欢pdf阅读器

、、

我如何安装一个PDF阅读器，像“杂技XI专业”，让我突出文本，有文字识别，让我组合和转换PDF格式和其他格式？

浏览 0提问于2015-02-02得票数 0

2回答

可将OCR文本插入回源PDF的OCR库

、

是否有库(或可执行文件)可以OCR PDF (通常是通过扫描纸张创建的PDF )，并将识别出的文本重新注入到PDF中？很可能是扫描图像背后的隐形文字。最好是开源的。(目标:我有一个巨大的由Lucene索引的PDF文件库。如果PDF包含文本，Lucene将更容易找到哪些PDF是相关的。)

浏览 3提问于2011-02-28得票数 2

1回答

如何使用Firebase ML工具包识别PDF文件中的文本？

、、

我正在开发一个Android应用程序来检测PDF文件中的文本。看起来Firebase ML工具包不支持PDF文件，对吗？使用Firebase ML工具包是否不可能识别PDF文件中的文本？

浏览 1提问于2019-03-07得票数 0

2回答

除PDF以外的所有文件链接的JS RegEx

、

我正在尝试匹配HTML文档中包含特定文件夹链接的所有href属性，而不是PDF。我很难让它匹配，我有一个可以得到所有PDF的：但我排除PDF的尝试并没有让我走得太远。有没有办法做我想要的，或者我只是匹配所有的文件而不是使用条件语句来检查它是否是PDF

浏览 1提问于2013-06-04得票数 0

1回答

我试图在PDF文件中找到一些文本，但结果并不准确！举个例子，我有两个PDF文件，其中有一个词domiciiado。当我搜索这个单词(domiciliado)时，doc取器只显示一个PDF文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个PDF文件？PDF文件之间有什么区别吗？在一个PDF中，我只有文本，而其他PDF是文本和图像，这是从扫描页面。陷阱是什么？ P.S.

浏览 0提问于2016-08-16得票数 0

回答已采纳

2回答

如何在用iTextSharp创建的pdf文件中显示汉字

、

我有字符串数据，其中包含一些英文字符和一些中文字符。我使用iTextSharp用这些数据创建了一个pdf文件。pdf文件创建后，当我打开它时，pdf只包含英文字符。它不显示汉字。你能告诉我如何在pdf文件中显示汉字吗？请注意，我写入pdf的字符串数据包含动态语言字符，即有时是英语，有时是中文，有时是日语等等。

浏览 2提问于2013-02-21得票数 3

回答已采纳

1回答

使用iTextSharp从PDF中提取盲文文本(图像)

、、、、

我正在尝试解码以盲文字体编写的PDF文件中的文本，并输出正常的文本。但是PDFTextExtractor (在iTextSharp中)不能处理这种字体。有没有可能用其他方式？我想知道如何从pdf文件中解码。我试着用，string text = PdfTextExtractor.GetTextFromPage(例如Arial)和

浏览 3提问于2011-08-07得票数 1

回答已采纳

1回答

OCR可以识别PDF文件吗？

浏览 164提问于2022-06-15

3回答

从二进制数据识别不带扩展名的文件类型

、、、

我有一些没有扩展名的文件。我希望将扩展关联到它们。为此，我编写了一个python程序来读取文件中的数据。我的疑问是，我如何才能在没有扩展的情况下识别其类型，而不使用第三方工具。我只能识别pdf，doc和文本文件。其他类型的文件是不可能的。我的服务器是cent。

浏览 0提问于2012-08-30得票数 3

回答已采纳

1回答

哪种中文字体是中国人民的PDF阅读器普遍支持的？

、

我正在生成PDF文件，其中包含英文和中文字符(使用Ruby对虾库)。我不想在生成的PDF文件中嵌入中文字体文件，因为这些文件需要保持较小。所以，我想知道我是否可以在PDF文件中提到一个中文字体名，让PDF阅读器正确地呈现汉字，因为PDF阅读器已经有了中文字体文件。这有道理吗？如果是这样的话，在大多数中国人使用的PDF<

浏览 2提问于2015-05-06得票数 2

回答已采纳

1回答

如何识别图像文件中的文本，以及如何阅读该文本？

、、

在图像格式中有满满的文字。(E)以图像文件*.tiff格式扫描的文件。光学字符识别方法只识别正常格式的字母表。在这种图像格式中包含的文字就像行文一样。那么如何识别中的文本并将其转换为文本文件呢？

浏览 8提问于2014-10-11得票数 2

1回答

检索文档的逻辑

、

在当今时代，我们对每件事都有大量的信息。有时，信息是巨大的，而不是数字化的。从一些类似的手册中找出具体的信息，以便实时地给用户提供基本信息，您会开发什么样的逻辑格式？用户无需阅读所有文档。您是否首先将文档转换为类似的结构？有什么建议吗？我知道这是某种文本搜索问题。让我举一个例子，使这个问题变得有点集中：Table of content 1.) The operator must use synthetic gloves to handle chemicalsMANUAL2：(用于Minesotta)

浏览 0提问于2012-04-27得票数 0

回答已采纳

1回答

关于拆分PDF和OCR识别

、、、

我有很多pdf文档，它们都是扫描过的文字版本。我需要在pdf中拆分一个页面。例如，如果有1个页面。我需要将一页分成页眉部分，页脚部分，主体部分和侧面部分。我知道Python的PDF和OCR库，但我找不到任何关于拆分单个页面的内容。然后，最后希望将pdf页面的拆分部分传递给OCR，以识别字符并将输出转换为csv或文本文件。提前感谢您……

浏览 18提问于2021-04-20得票数 0

回答已采纳

1回答

使用Java和Itext编辑PDF文本

、

有办法编辑PDF文档文本吗？比如找到和替换特定的文本？我能够编辑特定坐标(x，y)的pdf，但无法识别和替换。我看到的所有库都是从零开始创建的PDF和小的编辑功能。不管怎样，我可以用itext编辑上面的解释吗？请advise...thank你！ **例子:一份pdf文件载有以下的副翼。是最古老的古希腊和拉丁文，在单词或其他文字之间几乎没有空格，可以用bo

浏览 5提问于2014-07-10得票数 2

1回答

使用php在我的web应用程序中生成PDF文件

、

我想在我的网络应用程序中生成一个PDF文件。我使用的是php，我尝试了使用，我试图使用以下代码创建pdf：require('fpdf.php'); $pdf->AddPage();$pdf->Cell;?>

浏览 4提问于2014-04-07得票数 1

2回答

如何利用libharu库将泰文绘制成PDF文件

我正在使用免费的pdf库libharu生成PDF文件，但是我有一个编码问题，我不能在PDF文件上绘制泰语文字，所有的文字都显示“？..” 有人知道怎么修吗？谢谢

浏览 17提问于2010-07-31得票数 1

3回答

在Android中将图像转换为PDF

我需要在我的Android应用程序中以PDF文件的形式发送图像，但我不知道如何将位图转换为PDF。有什么解决方案吗？

浏览 2提问于2011-03-22得票数 15

回答已采纳

1回答

如何让转换笔记本命令在Mac上支持中文？我愿意为jupyter notebook贡献一些代码。

、

此命令成功地将不包含中文字符的笔记本文件转换为pdf。jupyter nbconvert test.ipynb --to pdf有没有办法解决这个问题？

浏览 3提问于2019-11-14得票数 2

2回答

柬埔寨字母表上的交货单

、、

我得到了一个问题与Prestashop 1.7.4.2交货单，它不能识别高棉文字母。有谁可以帮助我用哪种字体来显示这些字母？我已经在\override\classes\pdf\PDFGenerator.php中添加了支持的字体，但它不起作用。

浏览 1提问于2020-06-10得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

查找没有文本的PDF

Acrobat XI Pro喜欢pdf阅读器

可将OCR文本插入回源PDF的OCR库

如何使用Firebase ML工具包识别PDF文件中的文本？

除PDF以外的所有文件链接的JS RegEx

如何使用doc取器在PDF文件中搜索文本？

如何在用iTextSharp创建的pdf文件中显示汉字

使用iTextSharp从PDF中提取盲文文本(图像)

OCR可以识别PDF文件吗？

从二进制数据识别不带扩展名的文件类型

哪种中文字体是中国人民的PDF阅读器普遍支持的？

如何识别图像文件中的文本，以及如何阅读该文本？

检索文档的逻辑

关于拆分PDF和OCR识别

使用Java和Itext编辑PDF文本

使用php在我的web应用程序中生成PDF文件

如何利用libharu库将泰文绘制成PDF文件

在Android中将图像转换为PDF

如何让转换笔记本命令在Mac上支持中文？我愿意为jupyter notebook贡献一些代码。

柬埔寨字母表上的交货单

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐