我正在用Python中的Selenium做一些网络抓取,我在一个页面上有一个指向的链接,例如
<a href="/zip.php?zipid=103">Click Here To Download</a>
现在,当然,如果我点击它,我的浏览器将立即开始下载文件,例如myinterestingarchive.zip
我想知道的是,我是否可以注入一些JavaScript,比如说,它会告诉我文件名myinterestingarchive.zip
而不需要我点击链接,因为我想在我的程序日志中记录文件名,而它在源代码或OuterHTML中找不到,只有那个php url。
发布于 2018-12-12 04:11:51
如果它支持仅下载Http头HEAD
请求,您可以执行以下操作
import requests
......
# set the request with selenium cookies
cookies = {c['name']: c['value'] for c in driver.get_cookies()}
response = requests.head('http://....../zip.php?zipid=103', cookies=cookies )
print(response.headers['Content-Disposition'])
# attachment; filename=zip/myinterestingarchive.zip
是的,您可以使用注入的JavaScript完成此操作,但使用requests
会更简单
https://stackoverflow.com/questions/53730825
复制相似问题