首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Ubuntu中使用pdftkPDF文件进行合并、分离

Pdftk 是一个简单的命令行工具,用来进行日常的 PDF 文档处理,包括合并、拆分和加密、增加水印、解析PDF元数据、压缩和解压、修复受损的PDF文档等功能。...系统环境 Ubuntu 20.04 安装 使用snap包管理器来安装pdftk: $ sudo snap install pdftk 合并多个PDF 下面例子中将admin_guide.pdf started_guide.pdf...拆分PDF 使用burst参数来拆分PDF。...提取奇数页面 使用下面命令提取出文件中的奇数页,使用的参数是1-endodd意思是从第一页到尾页选择odd(奇数页),导出为odd-started_guide.pdf文件。...bob@ubuntu-20-04:~/test$ pdftk started_guide.pdf cat 1-endodd output odd- started_guide.pdf 提取偶数页面 使用下面命令提取出文件中的偶数页

1.3K20
您找到你想要的搜索结果了吗?
是的
没有找到

使用Python拆分和合并PDF文件

因此,我需要一种分割PDF文件的方法。虽然Adobe Acrobat Pro DC允许拆分和合并PDF文件,但需要付费。 Python就能够实现,谁不喜欢免费的解决方案呢?...安装Python库并将PDF文件装载到Python中 我们将使用PyPDF4库来处理PDF文件。...getPage()方法允许我们将PDF文件拆分为单独的页面,以便我们可以选择,然后使用Python将它们合并到一个文件中。...将上述代码放到一起 下面是允许你使用Python拆分和合并PDF文件的完整代码: from PyPDF4 import PdfFileReader,PdfFileWriter pdf =PdfFileReader...2.通过提取单个页面来拆分PDF文件。 3.将页面合并到新的PDF文件中。 注:本文学习整理自pythoninoffice.com。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

2.4K10

动态提取PDF内容的终极秘籍!兼一个超强网站推荐!| PA重要资源

看例子: 合并PDFpdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf 或者 (使用通配符): pdftk *.pdf cat output combined.pdf...180度: pdftk in.pdf cat 1-endS output out.pdf 使用128强度加密PDF(安全模式,只读) pdftk in.pdf output mydoc.128.pdf...通过上面的步骤得到pdf文件信息后,我们接下来先用比较基础的文本拆分方法从pdf信息中分离出pdf文件的页数,以后我们再讲其他更加方便的方法(但涉及到正则、或其他dos命令用法)。...Step-04 添加“拆分文本”操作,将上一步骤获取的pdf文件信息按“NumberOfPages:”拆分: 这样,pdf文件信息将被拆成2部分: 得到的结果中TextList[1]即为包含页数的部分...Step-05 继续添加“拆分文本”步骤对TextList[1]按“换行符”进行拆分 此时,我们会得到多行内容,其中第1行(标号为0)的内容即为页数,但要注意,这里是文本格式的内容,接下来要将文本转为数值

1.2K10

pdf文件插入一页,Power Automate是怎么自动做到的? | PA实战

- 2 - 在指定页位置插入 理论上来说,在指定页面位置插入其他pdf文件(页),可以通过两次使用“将PDF文件页面提取到新的PDF文件”功能,将pdf文件以指定要插入页面的位置进行“分拆”,提取成两个独立的...因为在第2步选择adv.pdf文件时,生成的文件列表外包含%%符号。...- 3 - 借助pdftk轻松插入页 前面提到,如果要通过拆分再合并的方式实现页面插入,需要借助pdftk工具进行页面数的识别,既然这样,倒不如直接使用pdftk工具的合并pdf文档命令——炒鸡强大、灵活...比如,要将adv.pdf文件插入到文件“01 Nov 2029.pdf”的第3页后,pdftk处理命令可写为: pdftk A="01 Nov 2019.pdf" B="adv.pdf" cat A1-...Step-03 在循环中添加“运行DOS命令” 注意其中的DOS命令写法: 1、pdftk命令要按自己存放pdftk工具的文件路径写完整:如我这里是“E:\RPA\pdf\PDFtk\pdftk.exe

87430

几百个pdf文件要删除广告页?Power Automate批量轻松搞定! | PA实战案例

- 1 - 待删除页在固定位置 这个情况也可以使用“将PDF页面提取到新的PDF”功能来实现,但是,问题在于仍然要借助pdftk工具识别出pdf文件的总页数,因此,我们直接使用pdftk工具的合并功能,...直接合并(删除)掉相应页面——该合并功能实在太好用,具体使用方法在此再举例赘述一下: 比如,要将adv.pdf文件插入到文件“01 Nov 2029.pdf”的第3页后,pdftk处理命令可写为: pdftk...Step-03 在循环中添加“运行DOS命令” 注意其中的DOS命令写法: 1、pdftk命令要按自己存放pdftk工具的文件路径写完整:如我这里是“E:\RPA\pdf\PDFtk\pdftk.exe...但是,经研究,发现pdftk支持我们将pdf文件按页拆成不同的文件(每页一个),这样,我们再针对拆分后的文件提取其内容进行判断,如果包含特定信息,我们直接把该页文件删除,然后再对剩下的页文件进行合并,不就能达到同样的目的了吗...经过以上拆分、提取文本、判断、删除页面、再合并的过程,我们达到了按内容删除pdf页面的目的。

1.2K30

在C#中,PDFsharp库使用(二):PDF拆分

它提供了一套丰富的 API,允许你以编程方式生成、编辑和渲染 PDF 文件 一、PDF拆分界面 二、PDF拆分代码 //PDF拆分--添加文件 //添加文件表Listbox中, //PDF拆分--添加文件...Files (*.pdf)|*.pdf"; // 设置文件过滤器 if (openFileDialog.ShowDialog() == DialogResult.OK) // 如果用户选择取消或者关闭...拆分---删除button //对Listbox中的列表进行操作删除 //PDF拆分---删除button private void button6_Click(object sender, EventArgs...拆分-输出目录Button 拆分后要输出的文件目录 //PDF拆分-输出目录 private void button7_Click(object sender, EventArgs e)...拆分---执行拆分Button //读取Listbox的列表,循环列表,按x页/每个文档的方式拆分, 如:按3页/每个文档 ,将输出:原文件名_1_3.pdf、原文件名_4_6.pdf...

19110

PDF Explained(翻译)第二章 构建一个简单的PDF

然后我们将使用 pdftk将其转换为有效的PDF文件,并在PDF查看器中进行查看。...关于PDFTK(THE PDF TOOLKIT) pdftk是一个开源的命令行程序,它的功能有: 合并分割PDF文档 旋转PDF页面 加解密 填充PDF表单 加水印和图章 打印和修改PDF元数据(metadata...构建元素 我们将PDF数据输入到文本文件中。 我们会跳过一些难以手动填充的信息,依靠pdftk来填充它。我们会: 使用简短的header。...pdftk来修复hello-broken.pdf文件,将输出写入hello.pdfpdftk hello-broken.pdf output hello.pdf pdftk读取文件及其对象,修补错误同时将缺失数据补全...3: 交叉引用表填入了每个对象的字节偏移量。 4: 写入了交叉引用表起始位置的字节偏移量。

1.3K30

前端使用puppeteer 爬虫生成《React.js 小书》PDF并合并

页面格式 await page.pdf({path: 'react.pdf', format: 'A4'}); // 关闭浏览器 await browser.close(); })(); 知道这启动浏览器打开页面关闭浏览器主流程后...3.7 返回宽高,用于设置视图大小 3.8 设置视图大小,创建生成 pdf 4、关闭浏览器 具体代码:可以查看这里爬虫生成《React.js小书》的 pdf每一小节的代码 // node 执行这个文件...(毕竟笔者是写程序的,所以就用代码来实现合并了) 这个 pdf-merge依赖 pdftk 安装 PDFtk Windows 下载并安装 笔者安装后,重启电脑才能使用。...apt-getinstall pdftk 使用例子 const PDFMerge = require('pdf-merge'); const files = [ `${__dirname}/1...2、用 puppeteer 生成每一小节的 pdf,用依赖 pdftkpdf-merge npm包, 合并成一个新的 pdf文件。或者使用Smallpdf等网站合并。

2.6K20

【科研工具】文献管理阅读工具Zotero7的安装与常用插件配置

并且,ReadPaper免费版文献上限为200篇,为了长久的科研和钱包考虑,我放弃了ReadPaper,开始使用开源免费的文献管理工具Zotero。...3.1官方同步 Zotero的每个账户有300M的免费云端存储空间,使用官方同步工具,只需要在设置中登录账户,勾选自动同步。...6.3 jasminum 一款对中文文献友好的插件,主要功能: 中文期刊附件(PDF/CAJ)的元数据抓取,支持添加PDF/CAJ时自动抓取元数据功能 集成 Zotero 中文社区转换器的下载与更新功能...为知网学位论文PDF添加章节书签(依赖于PDFtk) 更新中文文献引用次数,核心期刊信息 合并/拆分姓,名,识别文献条目语言,下载知网附件,统一日期格式等 6.3 Better Notes for Zotero...下面是我的配置参考,我主要需要的功能逻辑有三个: 下载的文献自动添加未读标签 看完的文献关闭后自动移除未读标签,添加读标签 快捷键Alt+1给标签添加⭐标记重要文献 配置完成后,读未读的文献会比较清晰

53400

从Slideshare.net 下载Slide的方法:

,然后右键->打印->常规->选中Adobe PDF为打印设备->打印     4)、使用Acrobat 8的合并文件功能,合并所有的pdf文件     这样就得到了SWF文件对应的PDF格式的幻灯片。...尤其是在将swf格式的文件转化为pdf格式时候,要手动对一个几十页的ppt执行以上操作不累死人才怪,因此方法归方法,我自己都不怎么使用。   ...需要安装swftools、pdftk、imagemagick 包     大致的方法:     1、使用wget -q –O 获得指定url地址文档的所有swf文件的实际地址并下载     2、使用swftools...4、使用pdftk将多个pdf文件合并成一个pdf文件      在合并多个pdf文件为一个pdf文件时候,由于需要按照页面顺序合并,因此使用了sort -k1.3       PDFS=`ls *.pdf...+adjoin %d.pdf     PDFS=`ls *.pdf | sort -k1.3 `     pdftk $PDFS cat output $DOCSHORT.pdf     cd

11.5K31

PDF标准详解(一)——PDF文档结构

因为PDF是可移植文档,它需要在不同设备上显示同样的内容,这里不能使用像素,如果使用像素,在同样尺寸的显示器上如果显示器的像素分辨率不同,那么显示的结果将会不同。所以这里一般使用磅作为单位。...我们使用PDF阅读器可以得到如下的页面 PDF文档一般的读取过程 不知道各位小伙伴们是否能看懂上面 Hello World 文档的定义。...再说明文档读取的过程前,我们先使用一些工具来补全这个文档,这里使用 pdftk 工具。...可以在这里 进行下载,完成之后,使用如下命令进行补全 pdftk hello.pdf output hello-full.pdf 成功后会得到如下内容 %PDF-1.0 %忏嫌 1 0 obj <<...例如该文档就可以使用Times-Italic字体显示 hello world字符串

25210

PDF Explained(翻译)第三章 文件结构

空白符如下表所示: 字符编码 含义 0 Null 9 Tab 10 换行(LF) 12 换页 13 回车(CR) 32 空格 PDF文件可以使用, 或作为行尾。...间接引用 为了将PDF内容拆分为单独的对象,我们使用间接引用将它们连接在一起。对对象6的间接引用写为: 6 0 R 6是对象编号,0是世代号,R是间接参考关键字。...通过这种方式,PDF应用程序可以逆序读取交叉引用部分, 以构建每个对象的最新版本的列表。替换的对象会保持原有的对象编号(译者注:世代号会改变)。...使用这些机制压缩的文件很难直接阅读,我们可以 使用pdftk中的解压缩操作,将它们解压以供审阅。...文件 将PDF文档比读简单得多, 我们不需要支持所有PDF格式,只需要支持我们打算使用的子集。

1.2K40
领券