前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python批量检查网页是否被注入其他页面

Python批量检查网页是否被注入其他页面

作者头像
Python小屋屋主
发布2018-04-16 14:57:42
1.1K0
发布2018-04-16 14:57:42
举报
文章被收录于专栏:Python小屋Python小屋

代码思路:对于给定的文件夹中所有网页文件,读取其内容,然后使用正则表达式检查该文件中是否包含iframe框架,如果有的话就返回文件名和iframe代码,表示是一个怀疑对象,但这并不意味着网页被攻击。使用代码快速挑选出所有的怀疑对象,最后再人工确认一下。

import os

import re

def detectIframe(fn):

#存放网页文件内容的列表

content = []

with open(fn, encoding='utf8') as fp:

#读取文件所有行,删除两侧的空白字符,然后添加到列表中

for line in fp:

content.append(line.strip())

#把所有内容连接成字符串

content = ' '.join(content)

#正则表达式

m = re.findall(r'<iframe\s+src=.*?></iframe>', content)

if m:

#返回文件名和被嵌入的框架

return {fn:m}

return False

#遍历当前文件夹中所有html和htm文件并检查是否被嵌入框架

for fn in (f for f in os.listdir('.') if f.endswith(('.html','.htm'))):

r = detectIframe(fn)

if not r:

continue

#输出检查结果

for k, v in r.items():

print(k)

for vv in v:

print('\t', vv)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档