前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >听说你的表情包不够用了?

听说你的表情包不够用了?

作者头像
树枝990
发布2020-08-19 09:55:36
4700
发布2020-08-19 09:55:36
举报
文章被收录于专栏:拇指笔记拇指笔记

导语

今天研究了会requests库。发现和urllib库功能类似,很好上手,因此写了个Demo爬了爬表情包。我选取了几个知乎里关于表情包问题的高赞回答,一共爬取了三个回答共六百多个表情包。

相关文件

相关程序获取:公众号 拇指笔记 后台回复“表情包”获取。

在安装好相关库后,只需要更改url,就可以实现爬取其他网页中的表情包。

表情包获取:公众号 拇指笔记 后台回复“表情包”获取。

爬取到的表情包我也一并上传到了公众号,回复即可获得全部表情包。

第三方库

代码语言:javascript
复制
re:正则匹配,用来提取图片信息
bs4:解析HTML文件
urllib :根据提取到的连接下载图片
requests:发送http请求

实现效果

爬到的表情包如下:

爬取表情包

整个程序实现还是很简单的,就是标准的爬取静态网页的过程。首先是确定需要爬取的信息位置,F12打开看一下,很快确定了图片的所在位置。

代码语言:javascript
复制
<img src="https://pic1.zhimg.com/80/v2-bffbbe33c937ceb498d0882bf21a651c_720w.jpg">

接下来就是使用bs4库解析一下get到的页面信息。四行代码就可以实现这一功能。

最后使用urllib库的urlretrieve方法下载图片即可,同时每下载一张图片需要改一次名。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 拇指笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 导语
  • 相关文件
  • 第三方库
  • 实现效果
  • 爬取表情包
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档