pdf图片文字提取 - 腾讯云开发者社区

、

我正在使用pdf.js。

浏览 2提问于2016-11-17得票数 2

回答已采纳

0回答

微信从图片上复制文字是怎么实现的？

、

微信中发送的图片或者截图提取文字后，可以从图片上复制文字，是怎么实现的？有没有前端组件？

浏览 54提问于2024-04-17

1回答

带有错误链接的tcpdf和图像

、

如果文字是不良链接的图片，则会显示错误，并且不会生成PDF文件。我希望能理解我的问题谢谢

浏览 0提问于2010-08-01得票数 0

回答已采纳

5回答

从PDF (google应用程序引擎)中提取文本

、、

有没有免费的Java库可以从PDF中提取文本，与Google应用程序引擎兼容？有没有其他方法可以从PDF中提取文本？我试过，不幸的是他们不能正确处理非英文字符。

浏览 6提问于2010-03-28得票数 2

回答已采纳

1回答

PdfBox从pdf中提取具有相同字体的文本

、、、

我需要从pdf中提取一段文字。本文具有与特征相同的字体族。有什么想法吗？干杯编辑：，让我用另一种方式问这个问题:我如何才能从pdf页面中提取出“粗体”文本？

浏览 1提问于2013-09-18得票数 1

1回答

使用(主pdf编辑器5)将页面导出到图像中时如何解决水印问题

、、

当我想要导出一个页面到一个图片使用主pdf编辑器5，它确实导出特定的图像与文字写在左上角说(主PDF编辑器-演示版本)，那么如何删除这个文本？见提供的图片：在这里输入图像描述

浏览 0提问于2022-01-05得票数 -2

1回答

复制从RMarkdown生成的PDF中粘贴文本？

、、

如果我们打开通过RMarkdown生成的PDF，我们如何将文本从这样的PDF直接复制/粘贴到另一个文本编辑器？其中应该有文本)，如果我们以铬打开相同的文件，我们会看到一些乱七八糟的文本，如是否有一种从RMarkdown生成的PDF

浏览 1提问于2020-01-27得票数 0

1回答

使用pyPDF读取时不能从PDF中获取正确格式的文本

、

我试图使用Python中的pyPDF包读取下面链接上的PDF文档。我使用了以下代码来读取PDF： import os from pyPdfPdfFileReader filename = os.path.abspath('F:/KG/per/Entr/equity research Text mining tool/HDFC_report.pdf</e

浏览 3提问于2015-08-03得票数 0

回答已采纳

1回答

如何在pdf文档中搜索字符串

、、、、

我有一个pdf文件，其中包含图像，超链接，文字和许多其他东西。我想在所有的文字中寻找刺痛，即图片和超链接被排除在外。如何用它编写java代码。有人能帮忙吗。

浏览 3提问于2020-07-24得票数 1

回答已采纳

1回答

Python导出wordcloud到pdf

、、、、

我想出口一个字云到pdf，而不是png，以避免失去质量时，放大。这是可行的，因为文字云本身已经是一幅图片了吗？plt.imshow(wc, interpolation='bilinear')plt.show() 但它返回一个pdf格式的图片以位图格式，就像一张png图片。我想得到一个真正的pdf<

浏览 1提问于2021-12-03得票数 0

回答已采纳

1回答

Python读取pdf文件

、

如何使用jupyter实验室从pdf文件中读取和提取表格？一个典型的pdf文件与文本之间的文字字幕和表格。我需要编码来提取特定标题下的表格，并清理一些不需要的文本，比如页码。

浏览 3提问于2022-09-19得票数 -1

4回答

CSS图标使用:在将文本从下面包装之前

当它包装的时候，文字就会在图标下面。目前的CSS： a[href $='.pdf']:before, a[href $='.PDF']:before, a[href $='.pdf#']:before, a[href$='.PDF#']:before, a[href $='.pdf?&#x

浏览 8提问于2016-04-19得票数 8

回答已采纳

1回答

在使用itext pdf生成pdfs时，CMYK映像正在生成非常大的pdfs。

、、、、

我正在使用Itext pdf生成有图像的pdfs。对于CMYK类型的JPEG图像，我得到的pdfs几乎是所用图像的两倍。但对于同一图像的RGB版本，pdf的大小与图像几乎相同。我想知道增加pdf的确切原因。请注意，pdf只包含图片和一些文字评论。

浏览 5提问于2014-05-20得票数 1

回答已采纳

1回答

Drupal节点与直接数据库

、

我正在编写我的第一个Drupal模块，当我应该使用节点而不是将数据直接存储在数据库中时，我会感到有些困难。有没有我能读到的关于这一主题的文件，或者有人对此有任何建议？让我开始寻找节点的是，我需要实现权限。该模块有许多项目，我需要能够控制哪些用户可以访问每个单独的项目以及与其相关的所有数据。对于我来说，如何使用节点来实现这一点并不明显，所以我考虑将其作为数据库中的另一个表来完成。

浏览 0提问于2012-11-20得票数 0

1回答

PDFBox:区分透明文本和非透明文本

、、、

我有一个任务，在那里，我必须提取文本，是背后的图像，并已从图像本身OCR编辑。这一案文是透明的。问题是，有一个图像，它的背后有文字，不是OCR编辑的，它只是正常的文本，它是不透明的。这是一个具有代表性的pdf文件：图像OCR文本应该在第2页、第3页、第12页上提取，而文本也在第4页上提取。在第4页，图像后面没有OCR文本，但是图像下面有规则文本。

浏览 6提问于2021-07-13得票数 0

回答已采纳

2回答

如何将波斯语IranNastaliq字体与iTextSharp结合使用

、、

当我是se irannastaliq字体时，所有的文字都显示我错了，我给你发了一个示例程序和pdf的图片，那个程序是创建的，pdf是我想要创建的，但我不能感谢您的关注。示例项目：

浏览 4提问于2013-11-02得票数 0

1回答

如何从PDF文件中正确提取日文txt

、

我需要从pdf文件中提取文本。谁能给我一个如何处理的提示？

浏览 5提问于2022-02-22得票数 1

回答已采纳

3回答

给定一个PDF，如何从命令行提取图像及其在页面上的位置？*

、、

我有一个PDF，其中包括文字和图像。我想使用linux命令行从PDF中提取图像。我可以使用pdfimages提取图像，但我也希望在每个页面上找到该图像所在的位置。

浏览 4提问于2011-01-03得票数 16

4回答

如何使用Python从PDF中提取表作为文本？

、、

我有一个PDF，其中包含表格，文字和一些图像。我想从PDF文件中的任何位置提取表格。 PDFfilename = "Sammamish.pdf" #filename of your PDF/directory where your PDF is storedPdfFileWriter() #create PdfFileW

浏览 4提问于2017-11-28得票数 47

回答已采纳

2回答

如何用谷歌翻译图片上的文字？

如果我遇到一个含有未知文本的图片文件，我可以为它拍另一张照片，然后用我的手机使用进行翻译，但我如何在我的电脑上翻译它呢？我试着输入谷歌翻译的图片链接，但显示无法打开文件。

浏览 18提问于2014-08-06得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

pdf.js获取有关嵌入式字体的信息

微信从图片上复制文字是怎么实现的？

带有错误链接的tcpdf和图像

从PDF (google应用程序引擎)中提取文本

PdfBox从pdf中提取具有相同字体的文本

使用(主pdf编辑器5)将页面导出到图像中时如何解决水印问题

复制从RMarkdown生成的PDF中粘贴文本？

使用pyPDF读取时不能从PDF中获取正确格式的文本

如何在pdf文档中搜索字符串

Python导出wordcloud到pdf

Python读取pdf文件

CSS图标使用:在将文本从下面包装之前

在使用itext pdf生成pdfs时，CMYK映像正在生成非常大的pdfs。

Drupal节点与直接数据库

PDFBox:区分透明文本和非透明文本

如何将波斯语IranNastaliq字体与iTextSharp结合使用

如何从PDF文件中正确提取日文txt

给定一个PDF，如何从命令行提取图像及其在页面上的位置？*

如何使用Python从PDF中提取表作为文本？

如何用谷歌翻译图片上的文字？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐