专栏首页算法channel有没有什么惊艳的微信头像?Python一键下载1000张!

有没有什么惊艳的微信头像?Python一键下载1000张!

bee君一直以来,对选用一个合适的微信头像,感到比较头疼。

今天bee君为大家推荐1000多张,非常惊艳的能用做微信头像的图片,都已按照类别分好类,文末提供下载方法,相信大家一定能从中找到一款自己喜欢的。

1 requests失败

使用requests请求微信表情图片网址https://www.zhihu.com/question/335825565, 同时使用web网页提取包:lxml,提取想要的所有图片链接地址,也就是下面的代码:

import requests
from lxml import etree
import pandas as pd
import re

url = 'https://www.zhihu.com/question/335825565'
with requests.get(url) as res:
    content = res.content
    print(content)
    html = etree.HTML(content)
    imgs = html.xpath('//figure//img/@src')
    print(imgs)

这样直接运行,content的打印显示如下,并没有请求到想要的结果。

b'<html>\r\n<head><title>400 Bad Request</title></head>\r\n<body bgcolor="white">\r\n<center><h1>400 Bad Request</h1></center>\r\n<hr><center>openresty</center>\r\n</body>\r\n</html>\r\n'

2 直接提取

换种直接的方法,打开网页https://www.zhihu.com/question/335825565,F12查看网页结构:

直接把此标签的全部内容copy到本地,并提取出所有图片的地址。

选中上面标签,右键->copy->copy element 直接把此标签的全部内容copy到本地,保存为wechat_pic.html

下一步,提取出所有图片的地址,直接使用python的正则模块提取就行。

第一步:导入用到的包

import os
import re
from urllib.request import urlopen

第二步~最后一步:读入上面复制的标签内容,使用正则表达式提取出需要的图片url,再使用urlopen从这个url下载图片文件,并保存到本地。这里面有一些细节问题,建议读者把代码下载后,跑跑试试。

with open('./data/wechat_pic.html',mode='r',errors='ignore') as f:
    lines = f.readlines()
    pic_urls = re.findall(r'<img src="(.*?).jpg"',lines[0])
    pic_urls = [pic for pic in pic_urls if pic.startswith('https')] # 只保留以https开头的地址
    #pic_urls = set(pic_urls) # 直接使用set会打破原来顺序,因为原网页按照图片分类,所以直接使用set去重,效果不佳
    downloaded = []
    for i,url in enumerate(pic_urls):
        if url in downloaded:
            continue
        print(f'{url}')
        q=urlopen(url+'.jpg')
        pic=q.read()
        
        save = open('./data/wechat_pic/%d.jpg'%(i,),mode='w+b')
        save.write(pic)
        q.close()
        save.close()
        print(f'pic{i} saved!')
        downloaded.append(url)

3下载图片

全部下载一共有图片1000多张,分为10几个类别,都能用做很惊艳的微信头像哦,自己挑选一张试试。

漂亮的小姐姐

部位放大图

动漫头像

好看的背景图

黑白图

简约风

表情头像

这是前186张图片的分类,其他800多张微信头像,请按照下面方式下载。

4 传送门

数据html文件,本文完整代码,下载到1000张微信表情图

统一下载方法:

1) 关注公众号

2) 并在这个号内回复:pic

本文分享自微信公众号 - Python与机器学习算法频道(alg-channel),作者:bee君

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • IPython 常用的6个魔术命令

    IPython 的「魔术」是 IPython 基于 Python 标准语法的一系列提升。魔术命令包括两种方法:行魔术命令(line magics):以 % 为前...

    double
  • 机器学习:如何处理数据不均衡问题?

    How to handle Imbalanced Classification Problems in machine learning?

    double
  • 统计学 常用的数据分析方法大总结,推荐收藏

    描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分...

    double
  • 图像预处理: 规范化

    Petrichor_
  • PHP中的MySQL使用--基于PDO

    不支持查询操作,返回受影响的行数。数据表使用此文中的pic表:MySQL指南之SQL语句基础

    张风捷特烈
  • bullet物理引擎与OpenGL结合 导入3D模型进行碰撞检测 以及画三角网格的坑

    原文链接:https://www.cnblogs.com/DOMLX/p/11681069.html

    徐飞机
  • 图像处理: jpg格式 存储-读写 时 像素值 微小变化 探究

    在做项目的过程中,想比较 同一幅图像 的 二值化处理结果 和 人工标注的ground_truth图 之间的差异。

    Petrichor_
  • 梳理前端开发使用 eslint 和 prettier 来检查和格式化代码问题

    前端正义联盟
  • Scala笔记

    DuncanZhou
  • 【R语言在最优化中的应用】用goalprog包求解 线性目标规划

    目标规划(goal programming) 是运筹学中的一个重要分支,它是为解决多目标决策问题而发展起来的一种数学方法。目标规划可以按照确定的若干目标值及其实...

    统计学家

扫码关注云+社区

领取腾讯云代金券