前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用XPath Helper完成Bing每日壁纸的小爬虫

用XPath Helper完成Bing每日壁纸的小爬虫

作者头像
zhaoolee
发布2019-03-11 10:39:35
5000
发布2019-03-11 10:39:35
举报
文章被收录于专栏:木子昭的博客木子昭的博客

为了让搜索变得有趣,谷歌提供了Google doogle, 微软提供了Bing壁纸, 百度直接抄了Google doogle(百度NB!), 作为一名摄影爱好者, 凭心而论, Bing每日壁纸的质量还是很高的, 值得收藏, 于是我写了一个获取Bing历史壁纸的爬虫(爬虫下载链接在文末)


写爬虫也需要好工具, 这里推荐XPath Helper!

安装XPath Helper

打开需要爬取的网站

https://bing.ioliu.cn/

打开XPath Helper, 输入/html/body/div[@class="page"]/span, 获取页数信息

获取图片日期信息

代码语言:javascript
复制
/html/body/div[@class="container"]/div/div[@class="card progressive"]/div[@class="description"]/p[@class="calendar"]/em

获取图片下载链接信息

代码语言:javascript
复制
/html/body/div[@class="container"]/div/div/a/@href

编写爬虫脚本,并运行

如果你不是程序员, 也可以使用编译好的bing.exe, 右键管理员身份运行即可~

爬虫脚本和.exe文件都被我放到了github上, 感兴趣可以自行下载, 链接地址 https://github.com/zhaoolee/ChromeAppHeroes/tree/master/%E7%9B%B8%E5%85%B3%E8%B5%84%E6%BA%90/bing

插件下载地址

https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl


本文属于Chrome插件英雄榜文集的一部分, 为了集合更多的程序员和工具爱好者, 将Chrome插件英雄榜维护下去, 我已将Chrome插件英雄榜 文集的所有内容托管到Github, 项目地址https://github.com/zhaoolee/ChromeAppHeroes , 欢迎广大程序员和工具爱好者们为项目贡献力量, 也欢迎拥有Github账户的朋友们为本项目加星, 非常感谢!

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.02.26 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装XPath Helper
  • 打开需要爬取的网站
  • 打开XPath Helper, 输入/html/body/div[@class="page"]/span, 获取页数信息
  • 获取图片日期信息
  • 获取图片下载链接信息
  • 编写爬虫脚本,并运行
  • 插件下载地址
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档