腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Ghostscript
PDF
到
文本
分隔符
ghostscript
我正在尝试用
ghostscript
将
PDF
转换为
文本
,命令如下:-dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=bla.txt c:\temp\example.
pdf
有没有办法指定要使用的
分隔符
,这样我的
文本
就会变成“猫|狗|12345”? 提前感谢
浏览 16
提问于2017-06-26
得票数 1
回答已采纳
2
回答
在C#中打开
PDF
,仅作为视图,不带adobe。
c#
、
pdf
我需要在我的C#项目中创建一个表单,它只允许用户查看
pdf
。 我有一种方法可以打开
pdf
并读取它,但我需要禁用打印、保存、高亮显示、复制/粘贴等功能,同时保持在文档中搜索的能力。
浏览 0
提问于2014-06-05
得票数 0
1
回答
如何使用
Ghostscript
将
PDF
转换为Word?
pdf
、
ms-word
、
ghostscript
谁能告诉我如何使用
Ghostscript
将
PDF
转换为Word?
浏览 16
提问于2012-03-07
得票数 1
1
回答
PDF
字体不可见
pdf
、
fonts
、
ghostscript
我使用
ghostscript
8.63将
pdf
文档分割成单独的页面。问题是分割的
pdf
文档中的一些
pdf
字体重叠(黑色补丁)。观察verdana-粗体字体
文本
。我复制了gostscript所需的所有字体
到
-sFontPath目录,并且
ghostscript
也打开了verdana,verdana粗体字体文件,但在拆分的文件中字体是不正确的。
浏览 4
提问于2010-08-31
得票数 0
1
回答
使用
GhostScript
将PostScript转换为
文本
text
、
unicode
、
fonts
、
ghostscript
、
postscript
我想从PostScript文档中提取
文本
数据。问题是,当我使用
GhostScript
来做这件事时,一些
文本
会被正常提取,而另一些
文本
会被转换成奇怪的符号字符。我意识
到
那些通常被提取出来的
文本
是字体,由于许可限制,
GhostScript
不会将它们嵌入
到
PDF
中。而且,具有讽刺意味的是,没有许可限制的字体通常嵌入
到
PDF
中,但没有正确地转换回来。我尝试了txtwrite设备直接将PostScript转换
浏览 2
提问于2013-11-12
得票数 1
1
回答
Ghostscript
没有从
PDF
文件中提取所有
文本
pdf
、
ghostscript
我使用鬼怪脚本8.71从
PDF
页面中提取
文本
。dDELAYBIND \ -dLastPage=1 input.
pdf
-dQUIET某些字体
文本
未被提取,例如:用粗体字符表示的Ver
浏览 3
提问于2010-09-01
得票数 1
1
回答
Ghostscript
文本
提取时间?
pdf
、
ghostscript
我正在从
pdf
中提取
文本
,为此我使用了
Ghostscript
v9.52 -dSafer -dBATCH -dNOPAUSE -sPDFPassword=thispdf -device="txtwrite" stdout
pdf
.
pdf
然后我试着降低渲染的分辨率,这样节省了一些时间,可以将其降低到大约300msdDEVICEWIDTHPOINTS=50 -dDEVICEHE
浏览 0
提问于2020-05-03
得票数 0
1
回答
Ghostscript
没有正确打印重音字符
linux
、
unicode
、
ghostscript
我有一个Bash脚本,它将
文本
水印写入
PDF
文件。它使用
Ghostscript
生成一个覆盖
PDF
,然后使用PDFtk将覆盖标记
到
原始文件上。所有这些都很完美,只是
Ghostscript
没有正确地编写重音字符。例如,如果我的输入
文本
是“Fran ais”,则
PDF
上的输出将是"Franˆ§ais“。setrgbcolor /Helvetica-Oblique findfont 9 scalefont setfont (${WATERM
浏览 3
提问于2014-08-27
得票数 0
回答已采纳
2
回答
处理多个文件时
Ghostscript
中的致命错误
python
、
ghostscript
Python 3.7.5
Ghostscript
版本: 9.5import sys import locale args=我注意
到
,即使在从Python控制台进行
文本
提取时也会出现此错误。提取第二个文件的唯一方法
浏览 7
提问于2019-12-12
得票数 1
1
回答
Ghostscript
9.15 -从大型.
pdf
文件拆分的文件已损坏
pdf
、
type-conversion
、
ghostscript
、
postscript
我使用一个工具将大型.
pdf
文件拆分成较小的部分,它使用
Ghostscript
来减小新生成的文件的大小。今天,我运行了这个工具,从itext-paulo-155中分割出一个
pdf
文件,所有的文件似乎都被正确创建了。但是,当我从新的和小的.
pdf
文件中选择字符并将其复制
到
文本
编辑器中时,它们都像这样损坏:ọχτφσ Ởωχκκω, Ọυω.不支持这种看起来很普通的.
pdf
文件,它们不是扫描的图像。我该怎么做才能让
ghostscri
浏览 1
提问于2015-02-10
得票数 0
3
回答
用嵌入式字体从
PDF
文件中提取
文本
linux
、
pdf
、
imagemagick
、
ocr
、
tesseract
我有一个
PDF
文件包含一些表格数据。 最后,我正在尝试一个OCR解决方案。我正在使用.tif将
pdf
文件转换为ImageMagick
浏览 2
提问于2012-09-07
得票数 4
回答已采纳
1
回答
混淆
文本
编码以防止自动解析和copy+paste
pdf
、
ghostscript
、
postscript
、
truetype
、
qpdf
我想让一个
PDF
在我的网站上可用,但想防止机器人的自动解析,可能不尊重正常的
PDF
“安全”。原因是,这也是商业出版,我被允许分享“个人使用”,但不能让它以这种方式广泛使用。我最初从Word中创建了
PDF
。 我曾尝试使用带有dNoOutputFonts选项的
Ghostscript
将
文本
转换为字形,但结果大得离谱(从2.5MB
到
180MB)。打乱
文本
编码似乎是一个很好的选择,但我几乎找不到任何讨论这一点的帖子。似乎有一个,但我无法找到一种方法,例如使用
Ghostsc
浏览 0
提问于2019-08-24
得票数 0
1
回答
Ghostscript
嵌入字体和替换
pdf
、
fonts
、
jpeg
、
ghostscript
我正在转换
PDF
到
JPG与gs。谢谢!
浏览 3
提问于2013-12-09
得票数 0
1
回答
正确地将
pdf
转换为ps,反之亦然
pdf
、
ghostscript
、
postscript
、
file-conversion
我使用“pdftop”将.
pdf
文件转换为.ps文件,然后使用"ps2
pdf
“进行反向处理(Poppler)。问题是,当从.
pdf
文件创建.ps文件时,
文本
看起来很好,但是当我试图复制它时,字符非常奇怪(就好像它们被破坏了一样)。我在其他文件上使用这些工具已经很长时间了,而且效果很好。我还尝试了"pdftohtml -xml“来创建一个.xml文件,
文本
没有问题(字符被正确提取)。 关于转换会有什么问题?也许如果我使用“pdftop”和"ps2
pdf
“,是否
浏览 1
提问于2012-05-28
得票数 5
1
回答
将数据保存为可编辑
Pdf
pdf
、
pdf-generation
、
ghostscript
我们有一个软件,可以创建用户报告并将其保存到
pdf
文档中。我们要用
Ghostscript
来做这个。我知道
PDF
“通常”是一种不可编辑的导出格式,但是我们的客户之一需要(出于法律原因)编辑这些文件的可能性。我读过
Ghostscript
浏览 1
提问于2013-11-07
得票数 1
回答已采纳
1
回答
使用Windows中的
Ghostscript
将多个
PDF
文件转换为子目录中的
文本
文件
bash
、
pdf
、
for-loop
、
ghostscript
、
extraction
操作系统: Windows 10 Professionalgswin64c -sDEVICE=txtwrite -o test1.txt "test1.
pdf
" 查找主目录和所有子目录中的所有
pdf
文件。在所有<e
浏览 2
提问于2017-08-03
得票数 2
回答已采纳
2
回答
GhostScript
PDF
合并(丢失可编辑字段)
php
、
pdf
、
ghostscript
我正在使用
GhostScript
合并到
PDF
为一个
PDF
。其中一个
PDF
具有我在Adobe Acrobat Pro 9中创建的
文本
框字段(可编辑字段)。当我用
GhostScript
合并这两个
PDF
时,我丢失了
文本
框字段。 有没有办法合并这些文件(使用GS或其他一些免费的linux软件),从而保持
文本
框字段的完整性?
浏览 0
提问于2009-08-06
得票数 4
2
回答
Ghostscript
呈现丑陋的
文本
pdf
、
ghostscript
、
text-rendering
为此,我使用XeLaTeX创建了一个
PDF
文件,然后使用
Ghostscript
将其呈现为(透明的) 96dpi-PNG。我希望将呈现的LaTeX与其余
文本
(使用标准的.NET GDI+方法呈现,但这是离题的)混合在一起,但我无法获得可靠的“好”
文本
呈现:输出总是看起来有点模糊或“不好”。示例:从左到右,用
Ghostscript
、Photoshop和TexWorks以96dpi呈现的相同(小)
PDF
(据我所知,它们内部使用
Ghostscript
)。我尝试
浏览 7
提问于2014-10-09
得票数 3
1
回答
Pdf
真实裁剪
pdf
、
crop
、
layer
我需要使用linux shell裁剪一个
pdf
文档,然后在裁剪后的
pdf
中提取
文本
。我的想法是使用pdfcrop linux工具裁剪
pdf
,然后使用txt2
pdf
文本
提取器工具来提取裁剪区域中的
文本
,但我意识到我是在图像上思考,当我尝试这样做时,结果与在原始的,而不是裁剪的
pdf
上做的是一样的由于
pdf
格式适用于图层,如果我不“裁剪”所有图层,结果将包含所有图层的所有信息,这是我不想要的。 如果有人知道如何在
pdf
中
浏览 0
提问于2014-11-03
得票数 0
3
回答
这是Adobe Postscript吗?
pdf
、
adobe
、
postscript
我假设这些确实是Adobe Postscript文件而不是**
PDF
文件,对吗?我在考虑通过ImageMagick或其他方式实现命令行perl,但现在我对它提供给我的东西感到有点困惑。
浏览 2
提问于2011-07-27
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券