前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用Python对你的微信好友进行一波骚操作

用Python对你的微信好友进行一波骚操作

作者头像
统计学家
发布2019-05-17 11:32:35
1K0
发布2019-05-17 11:32:35
举报

临近毕业,慢慢的也感伤起来,回想大学这几年,除了技术的成长,最值得庆幸的就是结交了一帮志同道合的好友。后期自己做了公众号,微信好友的数量也越来越多,身边人所扮演的角色也越来越丰富,有早已结婚生子为人父母的同学,有沉迷科研学术的教师,当然也少不了一众还在996的程序猿。事实上,你所处圈子的质量很大程度上就决定了你的人生质量,那么今天我们就来看看当 Python 遇到了你的微信好友后能擦出怎样的火花。

前言

这次我们直奔主题,本文要做的是以下几件事:

  1. 分析微信好友的总人数、男生数、女生数、男女比
  2. 分析好友的地域分布
  3. 利用 自然语言处理 的方法分析出你好友的情感倾向
  4. 获取微信好友的头像并拼接成指定图片

准备

还是老样子,做实验前,先做好准备工作,实验环境如下:

1.Python 3.6 (虚拟环境的管理为Pipenv)

2.Pycharm

3.主要使用到的包有:

  • itchat
  • pyecharts
  • baidu-aip
  • photomosaic
  • pillow

itchat是一个开源的微信个人号接口,可以让我们使用python来调用微信 pyecharts是python+echarts的结合,用于进行数据的可视化 baidu-aip是百度推出的一个nlp的包 photomosaic是用来生成蒙太奇马赛克图片的

大家获取到源码之后只需要将 Pipfile 复制到你们的项目根路径下,然后再终端执行 pipenv install 即可创建一个安装好所有包的虚拟环境了(前提是你的电脑上已经安装了pipenv了)

做好准备工作后我们就开始吧。

开始

1. 初始化 itchat

只需一行代码即可初始化 itchat:

代码语言:javascript
复制
itchat.auto_login(hotReload=True)

hotReload(热加载),True表示其短时间内不需要再次扫码登陆

2. 获取好友列表

同样的也只需要一行代码即可获取:

代码语言:javascript
复制
friends = itchat.get_friends(update=True)[0:]

返回的数据是类 JSON 格式的,我们用 Python可以很方便的解析,因为篇幅原因,返回的示例我就不展示了,你们自己输出查看就可以了。

3. 分析男女分布情况

首先我们需要获取好友的性别信息,通过分析返回的 JSON 字符串我们发现,在好友的信息中有 Sex 标签,其规律是当其值为1是表示男生,2表示女生,0表示没有填写的,因而我们可以这样

代码语言:javascript
复制
# 对好友数进行分析def analyze_friends_num(friends):    # 初始化性别的变量(男、女、其他,其他表示的是注册时没有填写性别信息的)    male = female = others = 0    # 循环得到的全部好友    # 在好友的信息中有Sex标签,发现规律是当其值为1是表示男生,2表示女生,0表示没有填写的    for i in friends[1:]:        sex = i['Sex']        if sex == 1:            male += 1        elif sex == 2:            female += 1        else:            others += 1    # 总人数    total = len(friends[2:])    print("总人数为", total, "其中男性", male, "人,女性", female, "人,男女比为", round((male / female), 2), ":1")

执行的结果为:

代码语言:javascript
复制
总人数为 387 其中男性 228 人,女性 116 人,男女比为 1.97 :1

更加直观的显示如下(可视化的代码在 utiils 包下,这里就不放出了,有需要的自己看源码):

我的好友里男女比竟然是 2:1(那些没填性别信息的人里面不知道还有多少男生),活该没有女朋友啊,看来下次要多加一些女生的微信了。

4. 好友地域分布

这里我们只要获取到好友的地域信息,然后用两个 dict (分别是省和市)保存即可,key 为地域, value 为该地域的好友数,循环遍历 friends 最后用饼图表示分布最多的5个省,用柱状图表示分布最多的15个市,代码如下:

代码语言:javascript
复制
# 分析好友的地域分布def analyze_friends_location(friends):    province = {}    city = {}    for i in friends[1:]:        if i['Province'] == '':            i['Province'] = '其他'        if i['City'] == '':            i['City'] = '其他'
        province[i['Province']] = province.get(i['Province'], 0) + 1        city[i['City']] = city.get(i['City'], 0) + 1    sorted_province = sorted(province.items(), key=lambda item: item[1], reverse=True)    sorted_city = sorted(city.items(), key=lambda item: item[1], reverse=True)
    # 画出分布图    draw_friends_location(sorted_province[0:5], sorted_city[0:15])

结果如下:

看到这大家应该也能猜到我主要的活动区域是哪了吧,有兴趣的大家可以猜一猜然后在文末留言哦。

5. 好友情感分析

当你想要了解一个人心态(注意是心态而不是动态)的时候,你往往都会去看他的签名而不是朋友圈,因为签名更改的频率很低,很大程度上会反映这个人的情绪和心态。相比之下,朋友圈更新的频率较高,因为是要分享自己近期的动态的(我就见过有的女生一条朋友圈分成好几条发,每次只发几个字)。因此对好友的签名进行分析是可以分析出她的情绪的,那么我们该如何分析情感呢?

这里实名夸奖一下百度,作为国内技术的老大哥,很久之前百度就已经免费开放了他的一些人工智能接口,其中就有情感倾向分析,官网是https://ai.baidu.com/tech/nlp_apply/sentiment_classify,这些免费的人工智能接口的开放对于我们这些个人开发者无疑是个福音。下面是他的功能演示截图:

他的用法也很简单,安装好baidu-aip包之后,申请下appkey、appid和secretkey后即可使用:

代码语言:javascript
复制
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
def analyze_text(text):    res = client.sentimentClassify(text.strip())    return res['items'][0]['sentiment']

因此我们要做的无非就是获取好友的签名,然后传入 analyze_text函数即可:

代码语言:javascript
复制
# 分析好友的签名def analyze_friends_signature(friends):    positive = 0    negative = 0    others = 0
    print('签名情感分析中,请稍后......')    for index, item in enumerate(friends[1:]):        text = item['Signature']        if text != '':            try:                print('正在分析第', index, '条签名:', text, '他的作者是:', item['NickName'], '你给他的备注是:', item['RemarkName'])                res = analyze_text(text)                if res == 0:                    negative = negative + 1                if res == 1:                    others = others + 1                if res == 2:                    positive = positive + 1            except:                continue

看到这有人会有疑问了,我的好友人数有上千,免费的接口能用这么多次吗?事实上,他真的可以用这么多次?

看到这我突然想给百度打call,这也太良心了吧。请问贵公司还缺实习生吗,我想去应聘?。然后我们来看看我的好友的情绪分析图吧。

没想到我的好友里面竟然还有17.83%的人有消极情绪,看来必要的时候得"we need to talk"了。

6. 利用好友的微信头像生成指定的照片

看标题你们可能不懂是什么意思,直接放图你们就明白了:

这张图远看是一张一个人跳舞的图片,其实仔细看就知道了,构成这张图的是我的 300 多张微信好友的图像,这里我使用到了一个名为 photomosaic的库,它是专门用来制作这种蒙太奇马赛克风格的图片的,是我无意中在知乎上看到的,所以大家有事没事还是逛逛知乎,多少能发现些好玩意。

接下来我们来看看如何生成上述图片。

第一步,我们先获取好友的头像:

代码语言:javascript
复制
# 获取好友头像def get_friends_avatar(friends):    for index, item in enumerate(friends):        print("正在下载第 %d 张头像" % index)        img = itchat.get_head_img(userName=item["UserName"])        file_image = open(os.getcwd() + "/app/temp/" + item["UserName"] + ".jpg", 'wb')        file_image.write(img)        file_image.close()

也很简单,直接调用itchat的 get_head_img方法然后保存到本地指定文件夹下即可。

第二步,利用photomosaic生成目标图片

代码语言:javascript
复制
# 利用好友头像生成蒙太奇马赛克图片def draw_friends_mosaic_image():    # 读取基准图,即要生成的蒙太奇马赛克图片的原始图    image = pm.imread(os.getcwd() + '/assets/cxk.jpg')    # 定义图片库    pool = pm.make_pool(os.getcwd() + '/temp/*.jpg')    # 制作50*50的拼图马赛克,(50, 50)是指每一行和每一列使用图片库中的图像的个数    mosaic = pm.basic_mosaic(image, pool, (50, 50))    # 保存制作好的图片    pm.imsave(os.getcwd() + '/output/friends_mosaic_image.jpg', mosaic)

四行代码即可,原理的话知乎上有写,有兴趣的可以自己去搜一搜。

当然了,不是每个人的微信好友都有上千人,所以拼接出来的效果就不是很好,比如我自己的那个就不是很好,既然这样的话我就推荐另一个拼接头像的方法,不过效果要稍微差点,拼成的图长这样:

这里的代码来自我关注的一个公众号,就不放出代码了,大伙感兴趣的可以去看下他的文章:《一键拼出你的微信好友图片墙》

这张图虽然观赏效果不如上一张,但好在每个头像都很清楚,大伙儿看看能不能快速找到自己的头像呢?欢迎在留言区评论互动哦~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 准备
  • 开始
    • 1. 初始化 itchat
      • 2. 获取好友列表
        • 3. 分析男女分布情况
          • 4. 好友地域分布
            • 5. 好友情感分析
              • 6. 利用好友的微信头像生成指定的照片
              相关产品与服务
              NLP 服务
              NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档