Python爬取自己微信好友信息,并制作好友签名词云

本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下:

《一件有趣的事: 爬了爬自己的微信朋友》

根据原作者的思路以及代码,爬取自己的微信好友信息并制作好友签名词云图,在本次实践中,主要使用itchat、jieba、wordcloud等包,原作者使用R进行图表可视化,我这里略做改进,使用了pyecharts包。

关于itchat包,中文文档:

1、https://itchat.readthedocs.io/zh/latest/

2、http://www.cnblogs.com/yanjingnan/p/6831464.html

Github地址:

https://github.com/littlecodersh/ItChat/tree/robot

关于pyecharts包:

https://github.com/chenjiandongx/pyecharts

实践过程如下:

1、安装一下itchat包,登录微信,爬取微信好友相关信息。

安装itchat包:pip install itchat

爬取微信好友相关信息:

2、获取自己微信好友的男女比例

3、安装pyecharts包,并绘制性别比例分布图

4、定义一个函数把好友昵称、省份、城市、性别、签名等数据都爬下来,存到数据框

5、读取数据文件并查看好友所在省份分布

(由于涉及隐私,未展示读取的数据结果)

6、微信好友个性签名的自定义词云图

此程序通过python3完成,在python2中涉及编码问题未能解决。待继续研究。

原文发布于微信公众号 - 大数据杂谈(BigData07)

原文发表时间:2017-08-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

教程 | BerryNet:如何在树莓派上实现深度学习智能网关

选自Github 机器之心编译 参与:蒋思源 该项目在树莓派 3 上使用深度学习使其成为一个智能网关。该设备并不需要联网,所有的训练和调试等都在树莓派 3 本...

39411
来自专栏章鱼的慢慢技术路

What exactly can you do with Python? Here are Python’s 3 main applications._你能用Python做什么?下面是Python的3

网站框架将帮助你创建基于Python的服务器端代码(后端代码),这些代码将在你的服务器上运行,与用户的设备和浏览器截然相反(前端代码)。像Django和Flas...

1131
来自专栏数据派THU

独家 | 手把手教你学习R语言(附资源链接)

作者:NSS 翻译:杨金鸿 术语校对:韩海畴 全文校对:林亦霖 本文约3000字,建议阅读7分钟。 本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言...

2687
来自专栏CreateAMind

Deep Learning Book 中文第十二章 大规模应用

大规模深度学习:GPU、分布式、压缩、动态结构等;视觉预处理等;自然语言,推荐系统介绍。

791
来自专栏GopherCoder

技术文档如何编写?

6305
来自专栏IT技术精选文摘

回归测试策略概览

本文要点 回归测试不同于其他类型的测试。 回归测试分为多种类型,因为不同的原因,采取不同的方法。 建立回归测试的策略,重点是要考虑上下文和其他一些因素。 回归测...

3334
来自专栏hotqin888的专栏

MeritMs价值和成果管理系统完善成果分析

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

824
来自专栏媒矿工厂

MMSys2018:3DTI系统和360Video系统的异同点【附PPT全文】

2018年6月12号至6月15号,第9届ACM多媒体系统会议(MMSys,ACM Multimedia Systems Conference)在荷兰阿姆斯特丹召...

811
来自专栏linux驱动个人学习

Cache 和 Buffer 都是缓存,主要区别是什么?【转】

1724
来自专栏IT技术精选文摘

使用Kafka在生产环境中构建和部署可扩展的机器学习

1537

扫码关注云+社区