Pdftk 是一个简单的命令行工具,用来进行日常的 PDF 文档处理,包括合并、拆分和加密、增加水印、解析PDF元数据、压缩和解压、修复受损的PDF文档等功能。...系统环境 Ubuntu 20.04 安装 使用snap包管理器来安装pdftk: $ sudo snap install pdftk 合并多个PDF 下面例子中将admin_guide.pdf started_guide.pdf...拆分PDF 使用burst参数来拆分PDF。...提取奇数页面 使用下面命令提取出文件中的奇数页,使用的参数是1-endodd意思是从第一页到尾页选择odd(奇数页),导出为odd-started_guide.pdf文件。...bob@ubuntu-20-04:~/test$ pdftk started_guide.pdf cat 1-endodd output odd- started_guide.pdf 提取偶数页面 使用下面命令提取出文件中的偶数页
知识点 使用Python操作PDF! 主要内容有:1、PDF拆分;2、PDF合并。 在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。...PDF拆分 很多时候,获取的PDF很长,我们如果想要截取其中某些页面那么怎么处理呢?有很多的工具可以完成类似的操作,我们用Python也能做到类似的事情。...pdf output = PdfFileWriter() # 读取pdf with open(pdf_in,'rb') as in_pdf: pdf_file =...,结束页 pdf_manage(pi, po, s, e) PDF合并 与pdf拆分相对的,是pdf的合并。...使用Python也能轻松完成,不早了,不废话了,还是直接上代码吧!
因此,我需要一种分割PDF文件的方法。虽然Adobe Acrobat Pro DC允许拆分和合并PDF文件,但需要付费。 Python就能够实现,谁不喜欢免费的解决方案呢?...安装Python库并将PDF文件装载到Python中 我们将使用PyPDF4库来处理PDF文件。...getPage()方法允许我们将PDF文件拆分为单独的页面,以便我们可以选择,然后使用Python将它们合并到一个文件中。...将上述代码放到一起 下面是允许你使用Python拆分和合并PDF文件的完整代码: from PyPDF4 import PdfFileReader,PdfFileWriter pdf =PdfFileReader...2.通过提取单个页面来拆分PDF文件。 3.将页面合并到新的PDF文件中。 注:本文学习整理自pythoninoffice.com。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。
看例子: 合并PDF: pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf 或者 (使用通配符): pdftk *.pdf cat output combined.pdf...180度: pdftk in.pdf cat 1-endS output out.pdf 使用128强度加密PDF(安全模式,只读) pdftk in.pdf output mydoc.128.pdf...通过上面的步骤得到pdf文件信息后,我们接下来先用比较基础的文本拆分方法从pdf信息中分离出pdf文件的页数,以后我们再讲其他更加方便的方法(但涉及到正则、或其他dos命令用法)。...Step-04 添加“拆分文本”操作,将上一步骤获取的pdf文件信息按“NumberOfPages:”拆分: 这样,pdf文件信息将被拆成2部分: 得到的结果中TextList[1]即为包含页数的部分...Step-05 继续添加“拆分文本”步骤对TextList[1]按“换行符”进行拆分 此时,我们会得到多行内容,其中第1行(标号为0)的内容即为页数,但要注意,这里是文本格式的内容,接下来要将文本转为数值
- 2 - 在指定页位置插入 理论上来说,在指定页面位置插入其他pdf文件(页),可以通过两次使用“将PDF文件页面提取到新的PDF文件”功能,将pdf文件以指定要插入页面的位置进行“分拆”,提取成两个独立的...因为在第2步选择adv.pdf文件时,生成的文件列表外已包含%%符号。...- 3 - 借助pdftk轻松插入页 前面提到,如果要通过拆分再合并的方式实现页面插入,需要借助pdftk工具进行页面数的识别,既然这样,倒不如直接使用pdftk工具的合并pdf文档命令——炒鸡强大、灵活...比如,要将adv.pdf文件插入到文件“01 Nov 2029.pdf”的第3页后,pdftk处理命令可写为: pdftk A="01 Nov 2019.pdf" B="adv.pdf" cat A1-...Step-03 在循环中添加“运行DOS命令” 注意其中的DOS命令写法: 1、pdftk命令要按自己存放pdftk工具的文件路径写完整:如我这里是“E:\RPA\pdf\PDFtk\pdftk.exe
- 1 - 待删除页在固定位置 这个情况也可以使用“将PDF页面提取到新的PDF”功能来实现,但是,问题在于仍然要借助pdftk工具识别出pdf文件的总页数,因此,我们直接使用pdftk工具的合并功能,...直接合并(删除)掉相应页面——该合并功能实在太好用,具体使用方法在此再举例赘述一下: 比如,要将adv.pdf文件插入到文件“01 Nov 2029.pdf”的第3页后,pdftk处理命令可写为: pdftk...Step-03 在循环中添加“运行DOS命令” 注意其中的DOS命令写法: 1、pdftk命令要按自己存放pdftk工具的文件路径写完整:如我这里是“E:\RPA\pdf\PDFtk\pdftk.exe...但是,经研究,发现pdftk支持我们将pdf文件按页拆成不同的文件(每页一个),这样,我们再针对拆分后的文件提取其内容进行判断,如果包含特定信息,我们直接把该页文件删除,然后再对剩下的页文件进行合并,不就能达到同样的目的了吗...经过以上拆分、提取文本、判断、删除页面、再合并的过程,我们达到了按内容删除pdf页面的目的。
它提供了一套丰富的 API,允许你以编程方式生成、编辑和渲染 PDF 文件 一、PDF拆分界面 二、PDF拆分代码 //PDF拆分--添加文件 //添加文件表Listbox中, //PDF拆分--添加文件...Files (*.pdf)|*.pdf"; // 设置文件过滤器 if (openFileDialog.ShowDialog() == DialogResult.OK) // 如果用户选择取消或者关闭...拆分---删除button //对Listbox中的列表进行操作删除 //PDF拆分---删除button private void button6_Click(object sender, EventArgs...拆分-输出目录Button 拆分后要输出的文件目录 //PDF拆分-输出目录 private void button7_Click(object sender, EventArgs e)...拆分---执行拆分Button //读取Listbox的列表,循环列表,按x页/每个文档的方式拆分, 如:按3页/每个文档 ,将输出:原文件名_1_3.pdf、原文件名_4_6.pdf...
1. pdfunite Linux 下可以使用 pdfunite 命令来合并多个 PDF 文件。...【注】源文件的路径名可以使用通配符,比如使用 * 来匹配目录下所有的 PDF 文件路径名,此时将根据它们的路径名按照字母表顺序来进行合并。...PDFtk PDFtk 是一款跨平台的命令行 PDF 编辑软件,它提供 PDF 文档分割、合并、加解密、翻转页面、等诸多功能。...pdftk 合并 PDF 的示例如下: pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf # 拼接多个 PDF 文件 pdftk A=1.pdf B=2.pdf...C=3.pdf cat A1-2 B2-3 C3 output abc.pdf # 从多个 PDF 文件中提取页面进行拼接 【注】pdftk 的其他功能示例参见官方示例。
然后我们将使用 pdftk将其转换为有效的PDF文件,并在PDF查看器中进行查看。...关于PDFTK(THE PDF TOOLKIT) pdftk是一个开源的命令行程序,它的功能有: 合并分割PDF文档 旋转PDF页面 加解密 填充PDF表单 加水印和图章 打印和修改PDF元数据(metadata...构建元素 我们将PDF数据输入到文本文件中。 我们会跳过一些难以手动填充的信息,依靠pdftk来填充它。我们会: 使用简短的header。...pdftk来修复hello-broken.pdf文件,将输出写入hello.pdf: pdftk hello-broken.pdf output hello.pdf pdftk读取文件及其对象,修补错误同时将缺失数据补全...3: 交叉引用表已填入了每个对象的字节偏移量。 4: 写入了交叉引用表起始位置的字节偏移量。
语法有点不寻常,因为它没有使用传统风格的 终端选项,但经过实践,它并不难记。...然而,也可以用 pdftk-java 将封面预置到 PDF 中: $ pdftk cover.pdf body.pdf \ cat \ output book.pdf 在这个例子中,动作是 cat ...将一个 PDF 分割成不同的文件 将一个 PDF 文件分割成许多不同的文件也使用 cat 动作,它的原理与删除页面相似。...你可以通过将你想要的页面发送到一个新文件来分割一个 PDF: $ pdftk book.pdf \ cat 1-15 \ output part-1.pdf$ pdftk book.pdf \ cat...首先,你必须使用 generate_fdf 动作提取表单数据。这将提取表单元素的 ID,并将它们放入一个文本文件。
1. pdfseparate Linux 下可以使用 pdfseparate 命令来分割 PDF 文件。...PDFtk PDFtk 是一款跨平台的命令行 PDF 编辑软件,它提供 PDF 文档分割、合并、加解密、翻转页面、等诸多功能。...如果你的 Linux 发行版上没有 pdftk 命令,需要手动安装 PDFtk 软件。...pdftk 分割 PDF 的示例如下: pdftk 123.pdf cat 1-45 output out1_45.pdf # 从单个 PDF 文件中提取指定范围页面 其中,cat...【注】pdftk 的其他功能示例参见官方示例。
页面格式 await page.pdf({path: 'react.pdf', format: 'A4'}); // 关闭浏览器 await browser.close(); })(); 知道这启动浏览器打开页面关闭浏览器主流程后...3.7 返回宽高,用于设置视图大小 3.8 设置视图大小,创建生成 pdf 4、关闭浏览器 具体代码:可以查看这里爬虫生成《React.js小书》的 pdf每一小节的代码 // node 执行这个文件...(毕竟笔者是写程序的,所以就用代码来实现合并了) 这个 pdf-merge依赖 pdftk 安装 PDFtk Windows 下载并安装 笔者安装后,重启电脑才能使用。...apt-getinstall pdftk 使用例子 const PDFMerge = require('pdf-merge'); const files = [ `${__dirname}/1...2、用 puppeteer 生成每一小节的 pdf,用依赖 pdftk的 pdf-merge npm包, 合并成一个新的 pdf文件。或者使用Smallpdf等网站合并。
并且,ReadPaper免费版文献上限为200篇,为了长久的科研和钱包考虑,我放弃了ReadPaper,开始使用开源免费的文献管理工具Zotero。...3.1官方同步 Zotero的每个账户有300M的免费云端存储空间,使用官方同步工具,只需要在设置中登录账户,勾选自动同步。...6.3 jasminum 一款对中文文献友好的插件,主要功能: 中文期刊附件(PDF/CAJ)的元数据抓取,支持添加PDF/CAJ时自动抓取元数据功能 集成 Zotero 中文社区转换器的下载与更新功能...为知网学位论文PDF添加章节书签(依赖于PDFtk) 更新中文文献引用次数,核心期刊信息 合并/拆分姓,名,识别文献条目语言,下载知网附件,统一日期格式等 6.3 Better Notes for Zotero...下面是我的配置参考,我主要需要的功能逻辑有三个: 下载的文献自动添加未读标签 看完的文献关闭后自动移除未读标签,添加已读标签 快捷键Alt+1给标签添加⭐标记重要文献 配置完成后,已读未读的文献会比较清晰
我们可以用任何其他端口号替换‘80’来检查端口是否被打开或关闭。 $nc-zvlocalhost80Connectiontolocalhost80port[tcp/http]succeeded!...47.lsof-iTCP:80-sTCP:LISTEN该命令会输出所用正在使用80端口的进程/服务的名称。在80端口运行下列命令会更好理解这个命令,它会列出所用运行在该端口的进程/服务。.../Desktop/squeeze.iso49.pdftkpdftk命令用来合并几个pdf文件。你必须安装有pdftk程序。如果还没有,请用apt或yum来获取相应的包。...$pdftk1.pdf2.pdf3.pdf….10.pdfcatoutputmerged.pdf50.ps-LF-uuser_name该命令会输出一个用户的进程和线程。
,然后右键->打印->常规->选中Adobe PDF为打印设备->打印 4)、使用Acrobat 8的合并文件功能,合并所有的pdf文件 这样就得到了SWF文件对应的PDF格式的幻灯片。...尤其是在将swf格式的文件转化为pdf格式时候,要手动对一个几十页的ppt执行以上操作不累死人才怪,因此方法归方法,我自己都不怎么使用。 ...需要安装swftools、pdftk、imagemagick 包 大致的方法: 1、使用wget -q –O 获得指定url地址文档的所有swf文件的实际地址并下载 2、使用swftools...4、使用pdftk将多个pdf文件合并成一个pdf文件 在合并多个pdf文件为一个pdf文件时候,由于需要按照页面顺序合并,因此使用了sort -k1.3 PDFS=`ls *.pdf...+adjoin %d.pdf PDFS=`ls *.pdf | sort -k1.3 ` pdftk $PDFS cat output $DOCSHORT.pdf cd
因为PDF是可移植文档,它需要在不同设备上显示同样的内容,这里不能使用像素,如果使用像素,在同样尺寸的显示器上如果显示器的像素分辨率不同,那么显示的结果将会不同。所以这里一般使用磅作为单位。...我们使用PDF阅读器可以得到如下的页面 PDF文档一般的读取过程 不知道各位小伙伴们是否能看懂上面 Hello World 文档的定义。...再说明文档读取的过程前,我们先使用一些工具来补全这个文档,这里使用 pdftk 工具。...可以在这里 进行下载,完成之后,使用如下命令进行补全 pdftk hello.pdf output hello-full.pdf 成功后会得到如下内容 %PDF-1.0 %忏嫌 1 0 obj <<...例如该文档就可以使用Times-Italic字体显示 hello world字符串
最后一个命令将使用sudo运行。 2.python -m SimpleHTTPServer:通过端口 8000 为当前工作目录创建一个简单的网页。...33.disown -a && exit Command:在后台运行命令,即使在终端会话关闭后也是如此。...47.lsof -iTCP:80 -sTCP:LISTEN.该脚本使用端口80输出所有服务,进程。...49.pdftk: 将许多 pdf 文件连接成一个的好方法。 50.ps -LF -u user_name:输出用户的进程和线程。
空白符如下表所示: 字符编码 含义 0 Null 9 Tab 10 换行(LF) 12 换页 13 回车(CR) 32 空格 PDF文件可以使用, 或作为行尾。...间接引用 为了将PDF内容拆分为单独的对象,我们使用间接引用将它们连接在一起。对对象6的间接引用写为: 6 0 R 6是对象编号,0是世代号,R是间接参考关键字。...通过这种方式,PDF应用程序可以逆序读取交叉引用部分, 以构建每个对象的最新版本的列表。已替换的对象会保持原有的对象编号(译者注:世代号会改变)。...使用这些机制压缩的文件很难直接阅读,我们可以 使用pdftk中的解压缩操作,将它们解压以供审阅。...文件 将PDF文档比读简单得多, 我们不需要支持所有PDF格式,只需要支持我们打算使用的子集。
, (X)HTML, XML, JSON, text 对于PDF文档,存在大量的附加功能:它们可以创建、合并或拆分。...Document.save()始终将PDF以其当前(可能已修改)状态存储在磁盘上。 通常,您可以选择是保存到新文件,还是仅将修改附加到现有文件(“增量保存”),这通常要快得多。...连接和拆分PDF文档 方法Document.insert_pdf()在不同的pdf文档之间复制页面。...下面是一个拆分doc1的片段。...关闭 在程序继续运行时,通常需要“关闭”文档以将底层文件的控制权交给操作系统。 这可以通过Document.close()方法实现。除了关闭基础文件外,还将释放与文档关联的缓冲区。
免费PDF工具v1.0(个人C#编程作品,免费使用) 一、功能: 功能就是要解决的问题 1.PDF合并:批量合并多个PDF文件为一个文件2.PDF拆分:批量拆分多个PDF文件,按x页/文档的方式拆分,重新命名...3.PDF提取:把一个PDF文件拆解为,一个为x-y页文件,一个为other文件 二、图文展示 1.合并 2.拆分 3.提取 三、部分代码 1.合并代码 //执行合并Button...mergedDocument.AddPage(page); } // 关闭输入文档...); } 2.拆分代码 //PDF拆分---执行拆分 private void button8_Click(object sender, EventArgs e)...记得分享给你的朋友,大家一起免费使用
领取专属 10元无门槛券
手把手带您无忧上云