2010年12月10日,黑客组织匿名者发布了一条消息,解释了他们发起最近一次代号为”复仇行动”的攻击的大致动机(Prefect,2010)。由于被那些放弃支持维基解密网站的公司所激怒,匿名者组织号召要通过对涉及的一些机构进行分布式拒绝服务攻击(DDoS)以实现报复。这个稿子上既没有签名,也没有标注消息来源,只是以PDF(Portable Document Format,便携式文档格式)文件的形式被发布出来。
PDF原文件第一页
PDF原文件第二页
查看元数据
(不要问我资源是哪里来的,作为程序员,对于获取资源的套路还是懂一些的...)
快速清除PDF元数据
清除后的效果
import PyPDF2
from PyPDF2 import PdfFileReader
import sys
import os
import re
#获取目录下所有的pdf文件目录
def getFiles():
files = os.listdir()
# 如果输入了单个pdf文件,则只输出单个pdf元数据
try:
if sys.argv[1]:
files = [sys.argv[1]]
except:
pass
pdf_files = list()
for file_name in files:
try:
result = re.match(r".*\.pdf$", file_name)
if result:
pdf_files.append(file_name)
except Exception as e:
pass
return pdf_files
# 打印文件的元信息
def printMeta(files):
for filename in files:
try:
pdfFile= PdfFileReader(open(filename, "rb"))
docInfo = pdfFile.getDocumentInfo()
print ("===文件%s的元信息为:"%filename)
for metaItem in docInfo:
print(metaItem,":",docInfo[metaItem])
except Exception as e:
print("---文件%s元数据无法读取,已经跳过!"%filename)
if __name__ == "__main__":
filenames = getFiles()
printMeta(filenames)
import sys
import os
import re
from PyPDF2 import PdfFileReader, PdfFileWriter
#获取目录下所有的pdf文件
def getFiles():
files = os.listdir()
pdf_files = list()
for file_name in files:
try:
result = re.match(r".*\.pdf$", file_name)
if result:
pdf_files.append(file_name)
except Exception as e:
pass
return pdf_files
def get_page_num(file_name):
#获取一个pdfFileReader对象
my_pdf = PdfFileReader(open(file_name,"rb"))
# 获取页数
page_num = my_pdf.getNumPages()
print("PDF文件%s的页数为%s"%(file_name, page_num))
return page_num
def create_new_pdf(file_names):
try:
os.mkdir("./pure")
except Exception as e:
pass
for file_name in file_names:
try:
# 获取原pdf的信息
my_pdf = PdfFileReader(open(file_name,"rb"))
# 创建一个PdfFileWriter对象
new_pdf = PdfFileWriter()
for i in range(0, get_page_num(file_name)):
page_info = my_pdf.getPage(i)
new_pdf.addPage(page_info)
new_pdf.write(open("./pure/%s"%file_name, "wb"))
print("文件%s已清除元数据!"%file_name)
except Exception as e:
print("文件%s编码有问题,已自动跳过!"%file_name)
if __name__ == "__main__":
create_new_pdf(getFiles());