腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9834)
视频
沙龙
1
回答
如何
从
PDF
中
保留
文本
布局
格式
和文本
字体
?
java
、
pdfbox
我想从
pdf
中提取
文本
与保持
布局
和
字体
样式
格式
使用Pdfbox 我使用的是Pdfbox版本2.0.16 import java.io.File; InputStream is = new FileInputStream(new File("filpath.
pdf
Read
PDF</
浏览 31
提问于2019-09-23
得票数 0
1
回答
在python
中
从
pdf
中提取
文本
而不改变
布局
和
格式
的最好方法是什么?
pdf
、
text
、
pypdf2
、
pdfminer
、
pdftotext
我想从
pdf
的确切
格式
和
布局
的
文本
。我已经试过PyPDF2,pdfminer和pdftotxt了。甚至我也尝试过使用AWS textract,但得到了不正确的
布局
。我使用了Zamzar API,它提供了准确的
浏览 0
提问于2019-10-14
得票数 0
1
回答
建议在asp.net mvc3
中
使用富
文本
编辑器,该编辑器具有页面大小设置、打印预览和页面缩放选项
.net
、
asp.net
、
asp.net-mvc
建议在asp.net mvc3
中
使用带选项的富
文本
编辑器2)支持在打印
布局
中放大页面4)导出为
PDF
格式
。 5)
字体
设置
和文本
格式
。
浏览 0
提问于2011-10-18
得票数 10
1
回答
在
pdf
文档
中
编辑
文本
样式
c#
、
pdf
、
itextsharp
、
edit
我正在开发一个C#控制台应用程序,该应用程序旨在编辑现有
PDF
文件
中
的
文本
样式,例如将
文本
样式更改为粗体或斜体,或添加
字体
系列,更改
文本
颜色.我使用了iTextSharp库,但遇到了以下问题:
从
现有文档中提取
文本
时,
文本
样式将被完全忽略(我指
字体
、粗体、斜体.)
从
PDF
文件中提取内容时,不读取特殊
格
浏览 2
提问于2012-11-21
得票数 0
回答已采纳
1
回答
Slideshare.net站点在iPad Safari
中
是
如何
工作的?
javascript
、
html
我现在正在探索在移动浏览器
中
打开Office文档,但确保用户没有访问该文件的权限。 我发现,即使不下载pps文件到iPad,幻灯片也能够显示演示文稿。
浏览 0
提问于2011-09-26
得票数 0
1
回答
用于main.m的编辑器,它
保留
了
格式
,即颜色
xcode
、
editor
我希望能够分享我的main.m和其他由XCode生成的
文本
文件,并且仍然保持
格式
和颜色。有没有这样做的建议,或者是针对某个特定的
文本
编辑器?我试着复制并粘贴到Libre Office
中
,但所有的颜色都丢失了,尽管标签和间距被
保留
了下来。凯文H。
浏览 0
提问于2015-02-13
得票数 0
5
回答
从
PDF
中提取所有内容
pdf
、
text
、
image
、
extract
寻找
从
PDF
文件中提取内容的解决方案(使用控制台工具或库)。 现在我们使用的是开源
pdf
2xml (提取
文本
、图像和链接)和GhostScript (快照和缩
浏览 7
提问于2009-11-12
得票数 8
回答已采纳
2
回答
保留
对
pdf
的喜爱
python
、
pdf
、
styling
、
epub
、
aspose.words
我目前正在进行一个项目,该项目将使用python将
pdf
转换为epub。当将
pdf
转换为epub时,
字体
大小必须与
pdf
的
字体
大小完全相同。是否有一种使用python实现这一目标的方法?#我使用的代码doc = aw.Document("Input.
pdf
") doc.save("Output.epub") 这是一个简单的
文本
pdf
。
浏览 23
提问于2022-06-14
得票数 0
3
回答
用hadoop
中
的mapreduce程序解析
pdf
文件
parsing
、
pdf
、
hadoop
、
mapreduce
、
pdfbox
我需要解析一个
PDF
文档,我有一个java程序来解析
PDF
文件。(当我解析
PDF
文件时,我使用了
PDF
中
这些段落的
字体
信息。我不会将它转换成
文本
,因为如果我将
pdf
转换成
文本
文件,我将直接失去
字体
information.so,我将使用Apache解析带有
字体
信息的
pdf
。);现在我需要编写一个map- cant程序来解析<
浏览 0
提问于2013-09-11
得票数 1
回答已采纳
2
回答
在ASP.Net页面内显示Word文档
asp.net
、
ms-word
我希望在aspx页面上的iFrame
中
按原样显示整个文档。
如何
在iFrame
中
显示word文档?
浏览 3
提问于2011-04-07
得票数 0
2
回答
从
XML生成高质量
PDF
的最佳方法是什么?
xml
、
pdf
我正在考虑
从
XML源创建一个高质量的
PDF
,作为在线照片簿创建工具的输出。
从
手动创建
PDF
(iText、PdfSharp等)到PrinceXML到xsl工具,完成这一任务实际上有数百个选项。以下是我想支持的一些特性: 真
浏览 7
提问于2011-07-18
得票数 5
回答已采纳
1
回答
根据
pdf
_reference_1-7,ToUnicode CMap比编码有更大的优先级,但是这里有一个相反的文件,我该怎么办?
pdf
、
pdfminer
原产地代码:(037)TjBaseEncoding: WinAnsiEncoding根据ToUnicode CMap,CID 31被映射到'3‘,这是错误的。/CIDInit /ProcSet findresource beginbegincmap<< /Registry (Adobe)/CMapName /Adobe-Identity-
浏览 1
提问于2019-07-01
得票数 1
回答已采纳
1
回答
幻灯片是否引用或使用SlideMaster或SlideLayout?
powerpoint
在PPTX文件
中
,会死掉一个slide.xml引用,或者以任何方式使用slidemaster.xml或slidelayout.xml文件?我之所以这样问是因为当您更改主程序或
布局
时,需要将它们应用到任何现有的幻灯片中。这让我认为,现有的幻灯片
从
主/
布局
中
复制它们所需的内容,但没有指向或引用它们。我们的应用程序读取PPTX,然后将其呈现为
PDF
格式
。如果没有使用主/
布局
,那么我们可以忽略那些当我们阅读幻灯片。 ??-谢谢-戴夫
浏览 4
提问于2020-08-03
得票数 0
回答已采纳
2
回答
用Python提取
PDF
文件的
文本
和表
python
、
pdf
、
ocr
、
pypdf2
、
pdfplumber
我正在寻找一个
从
PDF
文件中提取
文本
和表格的解决方案。虽然有些包适合提取
文本
,但它们不足以提取表。一种解决方案是使用Azure表单识别器
布局
模型,但是当我们有
文本
和表的混合时,它就失败了,特别是当表是某种
文本
格式
并且它们将表
和文本
的内容混合在一起时(请参见Azure Form Recognizer代码) 首先,对于一些
pdf
文件,pypdf2工作正常,但是它失败了,并且没有为一些pdfs (来自的
浏览 8
提问于2021-09-21
得票数 1
7
回答
从
PDF
文件中提取
文本
c#
、
java
、
pdf
我需要从
PDF
文件中提取
文本
。该
文本
可能是表格
格式
,它将用于外部方和我们的系统之间的数据自动传输。 有人能建议一个命令行工具(如
pdf
到txt)或者一个对此有好处的库吗?
浏览 18
提问于2009-08-14
得票数 7
回答已采纳
1
回答
Textbox:
保留
文本
文件的(简单)
格式
c#
、
.net
、
character-encoding
、
textbox
我
从
硬盘
中
读取了一个
文本
文件,然后希望将该
文本
放入
文本
框
中
,并
保留
文件
中
的相同
格式
(例如表格)。当我在一个简单的记事
本
中
打开文件时,
格式
很好,但当将
文本
放入
文本
框
中
时,
格式
有点奇怪,即:SET ID = :id,= :info,
浏览 1
提问于2012-01-24
得票数 1
回答已采纳
2
回答
如何
在一个庞大的
PDF
中
删除页面顶部不包含特定单词的页面?希望在C#
c#
、
pdf
所以我有这个2300+
pdf
PDF
,我需要处理。第一步必须删除我不需要的页面。例如,1到24页不包含我需要的任何信息,然后25到28页我确实需要,29到54页我不需要,等等。但我需要
保留
的每一页上都有"5天M.A.R.“在页面的顶部,所以任何不包含该内容的页面都需要删除。理想情况下,如果有一种方法可以创建一个C# (或类似的)应用程序,那么我可以触发它自动运行,因为我需要设置一个每小时处理一个
PDF
的进程。 谢谢你的建议。旧的程序是基于将一个大的
PDF
分成较小的
PDF
,基于
浏览 6
提问于2014-11-11
得票数 0
1
回答
呈现为
PDF
时不可选择的PhantomJS 2.0
文本
qt
、
pdf
、
fonts
、
phantomjs
、
renderer
几天前,我
从
on Linux Debian编译了Linux Debian 2.0。它编译成功,不幸的是网页
字体
有问题-当呈现成
PDF
格式
时,你不能选择
PDF
中
的
文本
,它就像图像一样。我使用以下CSS代码来设置
字体
: font-family: 'Lato'; font-weight: 300; src:,但
文本
不能选择。然而,如果我不
浏览 3
提问于2014-10-07
得票数 10
1
回答
Web浏览器
中
的
文本
/
字体
呈现。它是
如何
实现的?
html
、
pdf
、
text
、
fonts
、
browser
前提:我知道
PDF
文本
是通过一个理解
字体
并能够以图形形式呈现的C库来呈现的。例如,开放源代码的
PDF
库(如poppler或mupdf)依赖于freetype2,它负责呈现
字体
。问:我想知道在HTML浏览器中使用哪种方法来呈现
文本
和
字体
。
浏览 1
提问于2012-05-16
得票数 1
1
回答
iText
PDF
错误字符转换
java
、
pdf
、
itext
我有一份
PDF
文件要读,这让我很崩溃。现在问题来了。当我将粘贴
文本
从
pdf
复制到记事
本
时,我会得到一堆难以理解的字符.
pdf
包含所有
字体
,但不包含对应的cmap,以允许输出
文本
。我找到了,它引用了旧版本的itext(我使用的是5.5.5版
本
)。 如果可能的话,我想要实现的是
从
字形代码到unicode的
文本
转换。我
浏览 19
提问于2015-03-27
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDFpenPro for Mac(专业PDF编辑器)v12.2.2
如何在Word中编辑PDF
【图文0170期】PostScript(打PS)
微软新研究:让不可编辑的 PDF 文件实现可原格式编辑
PDF和TXT有什么区别?PDF怎么转TXT?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券