腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
pdf
.js获取有关嵌入式字体
的
信息
、
我正在使用
pdf
.js。获取带有字体信息
的
块
的
文本 str: "blabla", width: 191.433141, transform: Array[6], } 是否有可能以某种方式获得更多关于g_d0_f2
的
信息。
浏览 2
提问于2016-11-17
得票数 2
回答已采纳
1
回答
PDFBox解析器似乎解析,但是来自文本剥离器
的
空输出。
、
、
我在使用Android
中
的
PDFBox从文档中
提取
文本时遇到了一些问题。但是解析器似乎工作得很好(或者至少,我把它解释为这个意思;谷歌"parsed=COSObject“没有给出相关
的
结果,不幸
的
是(对于某些文档,logcat是垃圾邮件,似乎没有办法关闭这个putput))getCharactersByArticle返回该文档
的
空输出,即。向量列表是空
的
。对于我尝试过
的
大多数其他文档,文本
提取
工作得很
浏览 4
提问于2017-11-14
得票数 0
回答已采纳
1
回答
将置乱
的
PDF
字符重映射为可读
的
文本
、
、
、
我确实有一个问题,因为cups-
PDF
创建
PDF
文档,其中字符映射到奇怪
的
符号
[在Ubuntu 14.04
和
16.04}。我认为这是某种unicode,即使Python告诉我它
的
字符串类型。因此,它
的
真实,
PDF
有破坏文本信息,这是正确
的
PDF
文档本身。我不知道,但
文字
,
和
PDF
文件上
的
文字
图形似乎没有很紧
的
捆
浏览 1
提问于2017-04-18
得票数 0
回答已采纳
1
回答
为什么python要从
pdf
中
提取
符号
而不是文本?
、
我试图在一组文件夹
中
循环一组pdfs (都是OCR'd),并在
pdf
中
搜索关键术语,如果
pdf
包含某个术语,则保存文件夹名、文件名等。此代码在一定程度上起作用。但是,它在搜索项
中
缺少了一些pdfs。原因是当我在几个pdfs
中
阅读时,它会在几页上显示一些有趣
的
内容(至少对我来说是这样)。例如,假设我在一个名为“theone.
pdf
”
的
pdf
中
阅读过。它有278页。出于保密
的
浏览 0
提问于2018-05-15
得票数 1
回答已采纳
1
回答
Python读取
pdf
文件
、
如何
使用jupyter实验室从
pdf
文件
中
读取
和
提取
表格? 一个典型
的
pdf
文件与文本之间
的
文字
字幕
和
表格。我需要编码来
提取
特定标题下
的
表格,并清理一些不需要
的
文本,比如页码。
浏览 3
提问于2022-09-19
得票数 -1
1
回答
如何
使用VB.NET从带有标识-H字体
的
PDF
文件中
提取
文本
、
我有
PDF
文件。我
的
问题是
如何
使用VB.Net从
pdf
文件
中
读取标识-H文本。下面是我
的
代码: Dim sbPDFText As New StringBuilder() 'StringBuilderrende
浏览 3
提问于2014-08-15
得票数 1
回答已采纳
1
回答
Aspose
pdf
查看器
中
的
俄
文字
母链接问题
、
、
、
在我
的
java项目中使用嵌入式aspose
pdf
-previewer
和
doc-to-
pdf
转换器时,我遇到了一个编码问题。当我尝试使用com.aspose.words.Document.saveToPdf(...)方法将带有包含俄罗斯
符号
的
可点击链接
的
.doc文件转换为
pdf
文件时,我得到了一个很好
的
pdf
文件。但是当我尝试用标准
的
aspose
pdf
-previewer打开这个
浏览 0
提问于2013-08-19
得票数 1
1
回答
将特殊字符字节从
PDF
读取到unichar或NSString
、
、
、
、
首先,这个解决方案不适用于结扎:因此,为了简单起见,让我们说我有这个字符:最后,我想将它转换为这个( "fi“结扎
的
unico
浏览 4
提问于2014-07-18
得票数 0
回答已采纳
1
回答
谷歌云视觉API - OCR不返回
符号
条目
我们正在使用用亚洲语言(如日语
和
中文)创建
的
科学
PDF
文档。我们使用Cloud
的
DOCUMENT_TEXT_DETECTION特性类型从这些文档
中
获取文本,正如文档中所建议
的
那样。我们有要求突出显示块,
文字
和
字符(
符号
)在我们
的
网络应用程序,并让用户进一步处理在
pdf
预览
的
高亮区域。由于在响应boundingBox时缺少属性,所以不能总是显示
符号
的</em
浏览 3
提问于2021-06-04
得票数 1
1
回答
Rails:具有文本
和
表情
符号
的
HTML
和
respond_to
、
我正在尝试创建和下载一个
pdf
格式
的
html文件,其中包含
文字
和
表情
符号
(表情
符号
)
的
段落。在输出
中
,我能够获得正确
的
文本,但不能获得表情
符号
。我有一个包含以下函数
的
dashboard_controller.rb。def download_dashboard format.html format.
pdf
浏览 22
提问于2018-12-27
得票数 0
8
回答
如何
在Perl
中
从
PDF
文件中
提取
文本?
、
、
、
我正在尝试使用Perl从
PDF
文件中
提取
文本。我一直在命令行中使用pdftotext.exe (即使用Perl函数)从system文件中
提取
文本,这种方法工作得很好。问题是我们有像α,β
和
其他特殊字符
中
的
符号
,这些
符号
不会显示在生成
的
txt文件
中
。此外,在文本
中
随机添加
的
额外空格也很少。有没有一种更好、更可靠
的
方法来从
PDF
文件中
提取</
浏览 11
提问于2009-07-16
得票数 23
1
回答
有没有可能基于现有的
PDF
生成Telerik报告?
、
、
、
我有一个很长
的
PDF
时间跟踪文档,它被打印出来,并在纸质流程中用于安排约会。现在,此纸质流程正在转换为一个在线应用程序,并且此应用程序需要生成与
PDF
文档相同格式
的
报告(这一次是通过编程将值插入到行
中
,而不是让人将它们写在纸片上)。我
的
问题是,有没有可能以某种方式将
PDF
文档
的
布局导入到Telerik reporter
的
设计器
中
?否则,有没有什么中介工具可以让布局更具可输出性呢?只是为了澄清,我并不是要将我
的
浏览 3
提问于2012-02-09
得票数 0
回答已采纳
1
回答
使用pyPDF读取时不能从
PDF
中
获取正确格式
的
文本
、
我试图使用Python
中
的
pyPDF包读取下面链接上
的
PDF
文档。我使用了以下代码来读取
PDF
: import os from pyPdfPdfFileReader filename = os.path.abspath('F:/KG/per/Entr/equity research Text mining tool&
浏览 3
提问于2015-08-03
得票数 0
回答已采纳
1
回答
如何
在C#中
提取
Apache FOP创建
的
PDF
?
、
、
、
我想
提取
Apache FOP生成
的
PDF
文件编程没有任何第三方应用程序。我尝试使用许多库,如PDFBox,IKVM,
PDF
2Text,ITextSharp,PDFSharp来
提取
PDF
文件,但都失败了。当我将FOP生成
的
PDF
提取
到文本文件
中
时,我得到了许多正方形
符号
和
其他纠缠在一起
的
字符。 我
的
问题是,
如何
在C#中
提取
浏览 0
提问于2011-10-01
得票数 0
1
回答
仅针对某些pdfs
的
C#从
PDF
中
提取
文本
的
问题
、
我需要从
PDF
文件中
提取
一些数据。我正在用iTextSharp来做这件事。我使用
的
代码是我在网上创建
的
:using System.IO;{ ///它对某些
pdf
-s很好,但是对于我真正需要使用
的
pdf
文件,txt文件始终是空
的
。我没有收到错误,但出于某种原因,它没有写任何东西,虽
浏览 2
提问于2018-02-15
得票数 0
回答已采纳
1
回答
将俄语文本保存为
pdf
、
、
、
我尝试通过将文本保存为
pdf
。但我在保存俄语文本时遇到了问题。在创建
的
pdf
中
,我看到了所有的拉丁字母
和
符号
。但我没看到俄
文字
母。如果像这样写文本:"dfыва-:",在
pdf
中
我看到:"df-:“。我使用有俄
文字
母
的
字体。如果有人有同样
的
问题,请帮助。代码:PdfWriter.getIn
浏览 0
提问于2013-09-08
得票数 1
1
回答
PdfBox从
pdf
中
提取
具有相同字体
的
文本
、
、
、
我需要从
pdf
中
提取
一段
文字
。本文具有与特征相同
的
字体族。有什么想法吗?干杯 编辑:,让我用另一种方式问这个问题:我
如何
才能从
pdf
页面中
提取
出“粗体”文本?
浏览 1
提问于2013-09-18
得票数 1
3
回答
对虾带有一些ttf
的
表情
符号
-字体不能正确地呈现文本
、
、
、
我有一个红宝石脚本,以生成一个
pdf
文件与一些
文字
。文本
中
包含表情
符号
。第一行
文字
的
问题在于,当三个表情
符号
是一个单一
的
表情
符号
(由三个成员组成
的
家庭)时,它会打印出三个表情
符号
,这些表情
符号
由一个看起来像十字架
的
符号
隔开。第二行
的
问题是,它只是打印一个正方形而不是预期
的
表情
符号
(嘘脸)。我试
浏览 2
提问于2018-09-14
得票数 8
回答已采纳
2
回答
使用java从
pdf
中
识别
和
提取
表格
、
、
、
我有不同类型
的
pdf
,其中包含多个东西,如
文字
,表格等。该表可能存在任何地方
的
pdf
(顶部,中部,底部)。我只想
提取
表数据(否)。列上
的
,不。在不传递位置
的
情况下使用java从
pdf
中
提取
行
和
表
中
的
数据。 我使用iText java来读取
和
提取
。没有得到任何线索,以确定哪些表格存在
浏览 12
提问于2017-03-31
得票数 1
2
回答
这是一个有效
的
字体名称吗?- #82l#82r#82o#83S#83V#83b#83N
、
、
我正在使用
PDF
转换库在
PDF
文件
中
嵌入字体。/FontName /#82l#82r#82o#83S#83V#83b#83N如果是-谁能给我一个推荐人?
浏览 2
提问于2010-02-06
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券