开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用postscript从pdf流中获取pdf Mediabox

PostScript是一种页面描述语言，常用于打印和图形处理。它可以用于从PDF流中获取PDF Mediabox的信息。

PDF Mediabox是PDF文档中定义页面尺寸和边界的框架。它定义了页面的宽度、高度以及页面内容在页面上的位置。通过使用PostScript，我们可以从PDF流中提取这些信息。

在PostScript中，可以使用pdfmark操作符来获取PDF Mediabox。pdfmark操作符是一种用于在PostScript文件中插入PDF元数据的特殊操作符。通过使用pdfmark操作符，我们可以将PDF Mediabox的信息存储为PostScript变量，并在需要时进行访问。

以下是使用PostScript从PDF流中获取PDF Mediabox的步骤：

首先，需要将PDF流加载到PostScript环境中。可以使用PostScript解释器或相关的工具库来实现。
在加载PDF流后，可以使用pdfmark操作符来提取PDF Mediabox。pdfmark操作符的语法如下：
[ /Page pdfmark
<< /MediaBox [llx lly urx ury] >>
]
其中，llx、lly、urx、ury分别表示PDF Mediabox的左下角和右上角的坐标。
执行pdfmark操作符后，PDF Mediabox的信息将存储在PostScript环境中的相应变量中。
可以通过访问这些变量来获取PDF Mediabox的值，并在需要时进行处理或输出。

需要注意的是，PostScript是一种功能强大但复杂的语言，需要具备相应的编程知识和经验才能正确使用。在实际应用中，可以根据具体需求选择合适的工具或库来处理PDF流并提取PDF Mediabox的信息。

腾讯云提供了一系列与PDF处理相关的产品和服务，例如腾讯云文档转换（https://cloud.tencent.com/product/tmt）和腾讯云云扫描（https://cloud.tencent.com/product/ocs）。这些产品可以帮助用户在云端进行PDF文档的转换、识别和处理，提高工作效率和数据安全性。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一文搞懂PDF格式

根据PDF官方指南，理解PDF格式可以从四个方面下手——Objects（对象）、File structure（物理文件结构）、Document structure（逻辑文件结构）、Content streams（内容流）。

05

PDF Explained（翻译）第二章构建一个简单的PDF

本文是对PDF Explained(by John Whitington)第二章《Building a Simple PDF》的摘要式翻译。

03

PDF Explained（翻译）第一章简介

本文是对PDF Explained(by John Whitington)的摘要式翻译。

02

CVE-2015-2545 Word 利用样本分析

0 引子在上一篇文章中，我们分析了 Office 文档型漏洞 CVE-2015-1641 的利用，本文将继续对此类漏洞中的另一常见案例 CVE-2015-2545（MS15-099）展开分析。相较而言，这些 Exp 的威胁性更大，例如可采用“Word EPS + Windows EoP”的组合，且很多地方借鉴了浏览器漏洞的利用思路，因此还是很值得我们学习研究的。 1 样本信息分析中用到的样本信息如下： SHA256：3a65d4b3bc18352675cd02154ffb3880354630

07

市值950亿美元的SaaS公司传奇-Adobe的前世今生

当我们想到SaaS的成功案例时，首先映入脑海的可能是：Salesforce, Shopify，Workday，Zendesk, LinkedIn等，而Adobe则常常被人们所忽略。但Adobe的确已经做出了一系列精明的商业决策，以保持竞争力，并获得成功。这家软件公司最出名的产品是PostScript和Photoshop，它们为现代视觉设计铺平了道路，而对Omniture和Macromedia等公司的收购则巩固了它们在市场上的地位。 Adobe在科技界最令人印象深刻的举措之一是，从一家软件授权公司转型为一家

04

FreeSWITCH作为传真机时

FreeSWITCH的mod_spandsp模块提供了基于SIP的传真收发功能，但是mod_spandsp仅限于tiff文件，我们平时要发送的传真文件大部分是非tiff的，因此在发送前，我们就需要将这些文件统一转为tiff。

01

Linux系统六个最佳PDF文档阅览器，看看哪款更适合你

目前，互联网在线图书与其他相关文档正越来越多的使用PDF格式的文件，因此如果你使用的是桌面Linux发行版，那么选择一个合适的PDF阅览器就变得格外重要。在本文中我们列出了6个重要的PDF阅览器，它们可以在Linux系统上使用，不仅能够提供基本的阅读功能，而且完成文档处理等高级操作。 1.Okular Okular是一个由KDE开发的通用文档阅览器，同时也是自由软件。它能够在Linux、Windows、Mac OSX和其他类Unix系统上运行，支持多种文档格式包括PDF、XPS、ePub、CHM、Post

05

【漏洞预警】GhostScript -dSAFER沙箱绕过漏洞（CVE-2019-10216）预警通告

Ghostscript是一套基于Adobe、PostScript及可移植文档格式（PDF）等页面描述语言而编译成的免费图像处理软件，被广泛应用于图片处理组件。目前已经从Linux版本移植到其他操作系统，如其他Unix、Mac OS X、VMS、Windows、OS/2和Mac OS classic。

02

GhostScript -dSAFER多个沙箱绕过漏洞预警通告

2019年8月28日，Artifex官方在ghostscript的master分支上提交Bug 701446: Avoid divide by zero in shading，修复了4个-dSAFER沙箱绕过漏洞。-dSAFER是Ghostscript用于防止不安全PostScript操作的安全沙箱。

01

PDF新晋开发者须知

本文是对What new PDF developers need to know的摘要式翻译，同时加入了一些自己的理解。

02

encoding/ascii85

ascii85包实现了ascii85数据编码（5个ascii字符表示4个字节），该编码用于btoa工具和Adobe的PostScript语言和PDF文档格式。

02

pdf2image类库实现批量pdf转图片

通过pdf2image来实现对PDF文件的处理工作，我们本次主要做的是将PDF文件批量转成图片。之前写过批量提取封面的文章，传送：Python提取PDF第一页为封面图片【批量提取】，但是在后期的深入编写过程中遇到一些问题，近期再次深入编写程序，一起来看看代码吧！

02

「Adobe国际认证」Photoshop软件，关于绘图教程？

Adobe Photoshop 中的绘图包括创建矢量形状和路径。在 Photoshop 中，可以使用任何形状工具、钢笔工具或自由钢笔工具进行绘制。在选项栏中可以使用每个工具的选项。

02

Ghostscript：基于漏洞CVE-2018-17961的-dSAFER沙盒逃逸技术

今天给大家分析的是一种新型的ghostscript-dSAFER沙盒逃逸技术，目前这项技术仍然适用于当前正在使用的所有ghostscript版本。我不知道这个漏洞存在多久了，反正我是觉得已经很久了…

01

R语言_基础

a = c(1,2,3) #查看帮助 help(mean) ?mean example(mean) help.start() help(package="plyr") help(baseball)

07

全栈工程师的百宝箱：黑魔法之文档篇

今天收集Session数据的时候收集到了这样的一条，就是“全栈工程师的工具箱”。星期一又想不到什么可以写的内容，就来这样的一篇好了。以下的内容都是压箱底的，找个地方好好收藏。这篇是文档相关篇，介绍

Hive - ORC 文件存储格式详细解析

ORC的全称是(Optimized Row Columnar)，ORC文件格式是一种Hadoop生态圈中的列式存储格式，它的产生早在2013年初，最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每一个行组内进行按列存储。ORC文件是自描述的，它的元数据使用Protocol Buffers序列化，并且文件中的数据尽可能的压缩以降低存储空间的消耗，目前也被Spark SQL、Presto等查询引擎支持，但是Impala对于ORC目前没有支持，仍然使用Parquet作为主要的列式存储格式。2015年ORC项目被Apache项目基金会提升为Apache顶级项目。ORC具有以下一些优势:

04

R语言之可视化⑥R图形系统续目录

ggplot2包中的主要功能是ggplot（），它可用于使用数据和x / y变量初始化绘图系统。例如，以下R代码将数据集初始化为ggplot，然后将一个图层（geom_point（））添加到ggplot上，以创建x = Sepal.Length的散点图y = Sepal.Width：

01

PDF发明者逝世，曾因学生建议转行计算机，享年81岁

据Adobe公司官方网站公布，PDF格式发明者、Adobe公司联合创始人——Charles Geschke（查尔斯·格什克）于当地时间4月16日去世，享年81岁。

03

全栈工程师的百宝箱：黑魔法之文档篇

今天收集Session数据的时候收集到了这样的一条，就是“全栈工程师的工具箱”。星期一又想不到什么可以写的内容，就来这样的一篇好了。以下的内容都是压箱底的，找个地方好好收藏。这篇是文档相关篇，介绍一些实用的写作工具——都是脚本工具。作为近乎标准的Markdown就不说了~~，它也算不上是黑魔法~~。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭