Python爬虫——利用PhantomJS下载动态加载图片

在浏览网页过程中,我们会遇到一些让人心动的图片,这时我们需要将它保存在本地。一般我们用BeautifulSoup可以解析静态网页,但很多时候我们遇到的都是动态加载的图片,无法再利用urllib模块操作了。

本次分享将讲述如何利用PhantomJS来下载动态图片。我们的示例网址为:http://comic.kukudm.com/comiclist/43/395/4.htm,该网页只有一张动漫,读者不难发现,该图片是动态加载的。

我们解决问题的思路为:利用PhantomJS加载网页,然后利用page_source获取加载后网页的源代码,里面就有我们需要的图片的下载网址!接着运行BeautifulSoup解析得到图片网址,再用urllib.request.urlretrieve()函数下载图片即可。

以下为示例代码:

查看文件夹,我们发现图片已经下载完毕了。

动态图片下载

这样我们就能下载我们喜欢的动态图片啦

本次分享到此结束,如有不足之处,还请批评指正,欢迎交流

期待下一次分享^o^

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180605G0DZYH00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券