我试图通过使用python2.7中的爬虫来在网站的@media only screen CSS文件中找到特定的CSS媒体查询(CSS媒体查询)。
现在,我可以抓取网站/URL(从CSV文件中),使用以下代码在其HTML源代码中查找特定的关键字:
import urllib2
keyword = ['keyword to find']
with open('listofURLs.csv') as f:
for line in f:
strdomain = line.strip()
if strdomain: