发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/112554.html原文链接:https://javaforall.cn
Python中可以利用PyPDF2库来获取该pdf文件的总页码,可以根据下面的方法一步步进行下去: 1、首先,要安装PyPDF2库,利用以下命令即可: pip install PyPDF2 2、接着...补充知识:使用python合并pdf文件带书签 1、需求: 将几本纸质书进行了扫描,可是扫描的每页生成一个pdf文件。需要怎么才能把这些pdf文件合成一个呢?...网上找了下python合并pdf的脚本,发现也没有添加书签的功能的,有添加书签的也不是很灵活。 所有对网上找的一个python程序进行了升级,可以实现合并pdf并每个章节加入书签。...文件准备: 先将扫描的pdf文件,每一章放到一个文件夹中,文件夹名字用章节名命名。这样最终程序就能将章节名作为书签了,而不是默认将每页都生成书签。 ?...以上这篇Python利用PyPDF2库获取PDF文件总页码实例就是小编分享给大家的全部内容了,希望能给大家一个参考。
我们可以通过开发完接口后只需进行相应的配置后,通过swagger查看每个接口的使用说明以及返回值,但是swagger2默认接口是127.0.0.1的,这样前端人员在测试接口时使用的是127.0.0.1地址而不是部署该接口部署服务器的地址
每月一次的 Power BI 更新如期而至,本月更新个人认为是很有意义的。本文将详细描述这些内容。...报表方面: 全报表一键导出PDF 书签分组 主题正式发布 分析方面: 通过字段颜色值设置条件格式 集成 Python 问答改进 建模方面: 度量值支持数据分类 DAX新增统计类函数 自定义可视化以及数据连接可进一步参考官方文档...这里显示一个特殊的结果: 可以看出缺点: 导出方式比较机械,无法做细节设置 不支持页码等(可手工在报表页面添加) 不支持壁纸导出 可以看出优点: 可以导出除壁纸外的所有元素,包括自定义视觉元素 完全按照报表尺寸导出...,也就支持大尺寸的报表页 支持书签分组 在实际的项目中,书签会大量出现,包括实现跳转、导航等,随着 PowerBI 实现复杂的报表项目,书签很重要,因此书签分组变得很有意义。...支持PY 会 Python 的伙伴可以尝试与 PowerBI 结合了,如下: 这样,Power BI就可以和 R 以及 Python 并行工作了,当然用 Python 作图的效果无法实现交互式,有一定限制
之前分享过我写的一些工具整理下苏生不惑开发过的那些软件和脚本,不过导出的公众号pdf文件太多想合并成一个,于是用PDFShaper合并pdf,但合并后的pdf没有书签: 于是用python写了个pdf...&',topic_url).group(1) response = requests.get(topic_url, headers=headers) voiceids = re.findall('data-voiceid...mediaid={j}' # print(i,voice_url) audio_data = requests.get(voice_url,headers=headers) print('正在下载音频...() # to_word() 然后将转换的pdf合并成一个文件并生成书签。...",'wb') as f: file_writer.write(f) 合并后的效果: 点击左侧书签跳转到对应文章pdf(含留言): 当然也可以导出pdf的书签到excel,包含书签名和页码
书签的提取与写入 PDF书签提取 PDF书签保存到文件 从文件读取PDF书签数据 向PDF写入书签数据 给PDF加水印 生成水印PDF文件 PyPDF2库批量加水印 拷贝书签 加水印同时复制书签 PyMuPDF...但经过实测发现会爆出The Python instance can not be converted to a COM object的类型错误。...而ppSaveAsPDF常量的值为32,可以在https://docs.microsoft.com/zh-cn/office/vba/api/powerpoint.ppsaveasfiletype中查询到...] = i # 保存每个标题对应的标签数据,包括层级,标题和页码索引(页码-1) bookmark = [] def get_pdf_Bookmark_inter(outlines...除非你确实有批量给 PDF 文件加水印的需求。 需要注意使用 Python 的 PyPDF2 库给 PDF 加水印,采用的是叠加模式,实际并不能算是加水印,而是加背景。
它具有以下功能: 生成PDF文件:通过导入一批图片或已有PDF文件,生成包含图片及已有PDF文件指定页面范围的PDF文件。在生成文件时还可挂上书签。用此功能还可以拆分、合并PDF文件。...导出信息文件:将PDF文档中的元数据、阅读器初始状态、页码设置、页面设置、书签等信息导出成可编辑的XML文件。...补丁生成新文件: 将上述信息文件和已有PDF文件合并,生成新的PDF文档,该PDF文档具有XML信息文件的设置(如页面设置、书签等)。...添加、修改或删除PDF文档的书签,设置书签的文字颜色、打开或收拢状态、点击后的跳转位置及页面缩放比例等。 添加或修改页面内的链接。 添加或更改PDF文档的逻辑页码编号。...版本更新说明 0.2.7.2 2010年6月11日 新增功能: 生成文件时可选自动生成文档书签。 生成文件时可选保留源 PDF 文件的书签及页面链接。 生成文件可选关闭书签。
/master/base.user.css 例如: 但是导出的PDF中,目录却没有编号: 这是我使用Python处理该文件,使其具有编号,完整代码如下: # 博客地址:https://blog.csdn.net...# 用保存每个标题id所对应的页码 idnum2pagenum = {} for i in range(pagecount): page = pdf_reader.pages...[i] idnum2pagenum[page.indirect_ref.idnum] = i # 保存每个标题对应的标签数据,包括层级,标题和页码索引(页码-1) bookmark...pdf_reader = PdfReader(pdf_file) num_pages = len(pdf_reader.pages) pdf_writer = PdfWriter..." with open(pdf_file, "wb") as out: pdf_writer.write(out) print("已成功将书签写入到", pdf_file
split_pdf(infn, outfn) 3、追加:pdfWriter.appendPagesFromReader(reader) 书签:pdfWriter.addBookmark(title...也导致一些可纠正的问题是致命的,默认是 True warndest : 记录警告的目标(默认是 sys.stderr) overwriteWarnings(bool):确定是否 warnings.py 用自定义实现覆盖 Python...'> # 获取 pageObject 在 PDF 文档中处于的页码 pageNumber = pdfFileReader.getPageNumber(pageObj) print('pageNumber...,pagedest,rect,border=None,fit=’/fit’,args) 从一个矩形区域添加一个内部链接到指定的页面 addPage(page) 添加一个页面到这个PDF 文件,该页面通常从...= False) 从这个输出中删除图像 write(stream) 将添加到此对象的页面集合写入 PDF 文件 def addBlankpage(): readFile = 'C:/Users
合并 PDF 并添加书签 对于合并PDF,已经有很多成熟的代码了,我们拿来直接使用 from PyPDF2 import PdfFileReader, PdfFileWriter def merge_pdf...这样就可以方便的把当前目录下的所有PDF文件都合并到一个新的PDF当中,但是却有一个问题,就是没有书签,这对于一个教程类的文档来说,是及其不友好的,下面就来看看如何添加书签 根据 PyPDF2 的官方文档或网上的文章可以知道...,添加书签可以使用下面的代码 # 添加书签 pdfWriter.addBookmark(title, pagenum, parent=parent) 但是也就这么一句话,完全没有真实的使用实例 根据我的尝试可以得出...,对于 pagenum 参数,是用来指定书签页数的,要注意,PyPDF2 中PDF的页面是从0开始的,即在序列0添加书签时会跳到首页,在n处添加书签时会跳转至n+1页。...,分别是数据分析入门和Python Web 入门,Python Web 入门更新的慢一些,还在难产中。。。
每天你都可能会执行许多重复的任务,例如阅读 pdf、播放音乐、查看天气、打开书签、清理文件夹等等,使用自动化脚本,就无需手动一次又一次地完成这些任务,非常方便。...而在某种程度上,Python 就是自动化的代名词。今天分享 6 个非常有用的 Python 自动化脚本。...1、将 PDF 转换为音频文件 脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 PyPDF 提取 pdf 中的文本,然后用 Pyttsx3 将文本转语音。...大多数时候,我把遇到的网站或文章添加为书签,但我的书签每天都在增加,以至于现在我的浏览器周围有100多个书签。因此,在python的帮助下,我想出了另一种方法来解决这个问题。...in map(make_tiny, sys.argv[1:]): print(tinyurl) if __name__ == '__main__': main() 这个脚本非常实用,比如说有不是内容平台是屏蔽公众号文章的
还要注意的是,并非所有数据都始终包含有意义的数据——即使它们不是一个都没有。...• 对于PDF文档,可以使用更多的方法向页面添加文本或图像。 首先,必须创建一个页面Page。...以下是如何获取所有链接: # get all links on a page links = page.get_links() links是一个Python字典列表。...下面介绍如何操作PDF文档。 a....您可以通过指定选项incremental=True将更改写回原始PDF。这个过程(通常)非常快,因为更改会附加到原始文件,而不会完全重写它。 d.
还要注意的是,并非所有数据都始终包含有意义的数据——即使它们不是一个都没有。...对于PDF文档,可以使用更多的方法向页面添加文本或图像。 首先,必须创建一个页面Page。...以下是如何获取所有链接: # get all links on a page links = page.get_links() links是一个Python字典列表。...下面介绍如何操作PDF文档。 a....您可以通过指定选项incremental=True将更改写回原始PDF。这个过程(通常)非常快,因为更改会附加到原始文件,而不会完全重写它。 d.
python中将html转化为pdf的常用工具是Wkhtmltopdf工具包,在python环境下,pdfkit是这个工具包的封装类。如何使用pdfkit以及如何配置呢?分如下几个步骤。...1、下载wkhtmltopdf安装包,并且安装到电脑上,在系统Path变量中添加wkhtmltopdf的bin路径,以便于pdfkit的调用。...我们将方法名改成save_to_pdf,并且在get_body方法中直接返回str(div),而不是div.text。...---- 常见错误: IOError: No wkhtmltopdf executable found: python使用pdfkit中,如果使用pdfkit.from_url 或者pdfkit.from_string...之后还可以具体设置打印的细节,如“页码“,”布局“,”纸张尺寸“,”边距“和”选项“的设置。 ? 设置好之后选择”保存“按钮,在弹出的窗口填写好文件名称,就可以保存了。 ?
本文演示如何使用iTextSharp PDF库将文本文件转换为PDF文件。 iTextSharp是一个从JAVA项目iText衍生的.Net版本的开源项目,采用GPL许可证发布。...以使用IndentationLeft和IndentationRight,FirstLineIndent属性设置缩排; 六、锚点(Anchor) 如果你想在文档中添加一个外部链接(例如使用URL链接到WEB...I wanted to be an author myself that I wrote iText."); 外部链接注释: 你需要指定一个可点击的矩形和一个字符串(URL描述)或URL对象: Annotation...文件名称)和目的文件或页码。...十、章节(Chapter)和区域(Section) 章节的使用就比较少了,并且不太好控制,这就不作说明 十一、书签 简单创建书签,使用如下代码: 隐藏行号 复制代码 ? 这是一段程序代码。
这类对象会成为PDF文档中的目录。 大纲 “大纲”是指阅读PDF文档时的书签导航。 外链 “外链”是指所有在这个页面中且不指向它自身页面中锚点的超链接。...而最终执行的命令中的参数是命令行中参数与此参数读取的标准输入流中参数的结合。...[page] 当前正在被输出页面的页码[frompage] 第一页在文档中的页码[topage] 最后一面在文档中的页码[webpage] 当前正在被输出页面的URL[section..., y 是当前文档最后一页的页码。...repeatable) –post-file Post an aditional file (repeatable) –print-media-type* 使用的打印介质类型,而不是屏幕
因此,我们可以构造一个列表来存储页码:[1,2,3,4,5,11,12]。 从PDF文件中获取页面 我们可以使用pdf.getPage()从pdf对象获取特定页面。...记住,Python索引从0开始,而不是1,因此许多Python库都遵循此约定。getPage(0)是pdf文件的第一页,pdf.getPage(11)是最后一页。...之前,我们已经创建了要提取的页码列表:pages=[1,2,3,4,5,11,12]。由于Python基于0的索引,我们需要将每个数字移位1。只要把所有的数字循环一遍,然后从每个数字中减去一个。...2.在每个PDF文件中,遍历页面,并将每个页面添加到PdfielWriter对象中。 3.通过调用PdfFileWriter.write()方法保存新PDF。...','wb') as f: pdf_writer.write(f) 小结 我们已经介绍了如何使用Python处理PDF文件: 1.获取有关PDF文件的基本信息。
领取专属 10元无门槛券
手把手带您无忧上云