首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

在python中有多个对应的库可以操作Pdf文件,其中最常用的是Pypdf2

PageObject对象;from PyPDF2 import PdfFileReader #引入readerpdf = PdfFileReader(input_path) #初始化一个reader对象,传入文件路径infomation...引入readerpdf = PdfFileReader(input_path) #初始化一个reader对象,传入文件路径#pdf = pdf.decrypt('password') #对加密的文件机密infomation...pdf.getDocumentInfo() #获取文档信息number_of_pages = pdf.getNumPages() #获取总页数txt = f'''{input_path} information:Author : {infomation.author...},Creator : {infomation.creator},Producer : {infomation.producer},Subject : {infomation.subject},Title...: {infomation.title},Number of pages : {number_of_pages}''' print(txt) #以上信息,除了页数,对于一下文件可能不存在#这个库不适合读取文档内容

82010

人与代码的桥梁-聊聊SAST

在理解如何分析AST语法树之前,我们首先要明白infomation flow、source、sink三个概念, source: 我们可以简单的称之为输入,也就是infomation flow的起点 sink...: 我们可以称之为输出,也就是infomation flow的终点 infomation flow,则是指数据流动的过程。...在分析infomation flow的过程中,明确作用域是基础中的基础.这也是分析infomation flow的关键,我们可以一起看看一段简单的代码 如果我们很简单的跟踪赋值关系去回溯,而没有考虑到函数定义的话...为了解决,这样infomation flow的方向从逆向->正向的问题。 (2) 多重调用链 这是一段有漏洞的JS代码,人工的话很容易看出来问题。...但是如果在自动化分析过程中,当回溯到Source为$_GET[‘a’]时,已经满足了从Source到sink的infomation flow,已经被识别为漏洞。一个典型的误报就出现了。

31310

从0开始聊聊自动化静态代码审计工具

在理解如何分析AST语法树之前,我们首先要明白infomation flow、source、sink三个概念, source: 我们可以简单的称之为输入,也就是infomation flow的起点 sink...: 我们可以称之为输出,也就是infomation flow的终点 而infomation flow,则是指数据在source到sink之间流动的过程。...在分析infomation flow的过程中,明确作用域是基础中的基础.这也是分析infomation flow的关键,我们可以一起看看一段简单的代码 如果我们很简单的通过左右值去回溯,而没有考虑到函数定义的话...为了解决,这样infomation flow的方向从逆向->正向的问题。 通过新建大作用域来控制作用域。 (2) 多重调用链 这是一段有漏洞的JS代码,人工的话很容易看出来问题。...但是如果在自动化分析过程中,当回溯到Source为$_GET['a']时,已经满足了从Source到sink的infomation flow。已经被识别为漏洞。一个典型的误报就出现了。

1.5K10
领券