Python爬取自己微信好友信息,并制作好友签名词云

本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下:

《一件有趣的事: 爬了爬自己的微信朋友》

根据原作者的思路以及代码,爬取自己的微信好友信息并制作好友签名词云图,在本次实践中,主要使用itchat、jieba、wordcloud等包,原作者使用R进行图表可视化,我这里略做改进,使用了pyecharts包。

关于itchat包,中文文档:

1、https://itchat.readthedocs.io/zh/latest/

2、http://www.cnblogs.com/yanjingnan/p/6831464.html

Github地址:

https://github.com/littlecodersh/ItChat/tree/robot

关于pyecharts包:

https://github.com/chenjiandongx/pyecharts

实践过程如下:

1、安装一下itchat包,登录微信,爬取微信好友相关信息。

安装itchat包:pip install itchat

爬取微信好友相关信息:

2、获取自己微信好友的男女比例

3、安装pyecharts包,并绘制性别比例分布图

4、定义一个函数把好友昵称、省份、城市、性别、签名等数据都爬下来,存到数据框

5、读取数据文件并查看好友所在省份分布

(由于涉及隐私,未展示读取的数据结果)

6、微信好友个性签名的自定义词云图

此程序通过python3完成,在python2中涉及编码问题未能解决。待继续研究。

原文发布于微信公众号 - 大数据杂谈(BigData07)

原文发表时间:2017-08-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏瞎说开发那些事

RPA与AI认知--Microsoft Text Analysis

23760
来自专栏Petrichor的专栏

如何画 软件工程 流程图

个人推荐一款常用的免费在线绘图工具:ProcessOn 。之前也看过比较过其他的 流程图绘图工具 ,要么是功能不够强大,要么就是伸手向咱学生党要钱,或者只给个短...

28130
来自专栏CDA数据分析师

这4件事带你走出深陷的数据分析迷宫

通过真实世界中的实例,我们将共同通过种种错误的数据分析方式总结出正确的技巧与诀窍。 相信每位朋友都遇到过这样的情况:将来自各类渠道的数据收集起来,通过A/B测试...

21860
来自专栏GopherCoder

技术文档如何编写?

1.2K50
来自专栏CreateAMind

Deep Learning Book 中文第十二章 大规模应用

大规模深度学习:GPU、分布式、压缩、动态结构等;视觉预处理等;自然语言,推荐系统介绍。

8810
来自专栏hotqin888的专栏

MeritMs价值和成果管理系统完善成果分析

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

9540
来自专栏媒矿工厂

MMSys2018:3DTI系统和360Video系统的异同点【附PPT全文】

2018年6月12号至6月15号,第9届ACM多媒体系统会议(MMSys,ACM Multimedia Systems Conference)在荷兰阿姆斯特丹召...

9910
来自专栏小狼的世界

BLOG首页展示的几种方式

大约在多年以前,按照日志的时间格式进行排列的类似于编年史样的风格非常流行,但是最近,摘要形式的首页展示开始变得流行起来,还有一些其他的展现形式,我们的Blogg...

7710
来自专栏AI研习社

七步即可学会R语言,从此数据分析不再怕!

本文特约作者为 DataCamp 的联合创始人 Martijn Theuwissen 。更多 R 语言资源请访问这里(http://t.cn/R9Uo2po)...

35930
来自专栏吉浦迅科技

推荐5种让数据库快的飞起的GPU加速产品

GPU承诺会彻底改变大数据分析领域,从当前来看,这并不是虚言,当我们数据量达到一定级别的时候,我们一定会转向使用GPU。大多数的数学密集型应用都包含机器学习框架...

52690

扫码关注云+社区

领取腾讯云代金券