0.前言
上次查看了微信好友的位置信息,想了想,还是不过瘾,于是就琢磨起了把微信好友的个性签名拿到,然后分词,接着分析词频,最后弄出词云图来。
1.环境说明
介绍 Pycharm 安装第三方包的方法。
由于某些包不能直接用 Pycharm 安装,所以这里说一下安装的方法。
安装wordcloud
worcloud需要numpy> = 1.5.1,pillow和matplotlib,所以要先安装numpy,pillow和matplotlib。
在下面这个链接找到合适的whl文件,http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
如果是电脑是64位,python是3.6就下载下面这个。
下载回来就放到Python的目录下,就比如我是把 Python 安装在E:\Python36这个目录,就把下载回来的 wordcloud-1.3.3-cp36-cp36m-win_amd64.whl 放在这。
然后按win键+R ,输入cmd,回车
然后cd 到 Python 目录那
接下来就是安装了,pip install wordcloud-1.3.3-cp36-cp36m-win_amd64.whl
除了这个以外,某一个包需要翻墙才能安装,具体是哪个就不记得了,好像是 pandas。
2.相关代码
先把需要的东西导入,安装这些包可不简单
登录微信
获取数据
把个性签名中的 emoji 和别的东西过滤一下
使用结巴分词进行分词,用 matplotlib 把图画出来
3.运行
先说明一下,如果能看懂代码,知道该怎么把必要的文件弄好,那就不怎么需要看下面这个。
如果看得不太理解,运行前一定要在 E 盘建立一个文件夹。路径是 E:\Python\Wechat ,然后在文件夹中放入一张命名为 toux.jpg 的照片,具体图片看个人喜好。
最好就是下图这样的照片
这样生成的词云就会很好看
意思就是图片要有白色的背景,人物颜色较鲜艳,人物突出(图片分辨率要高)
把代码安装顺序复制到 Pycharm,然后鼠标右键,选择 Run,扫描弹出来的二维码,登录微信网页版,确认后等待一下,看到下图就说明代码运行得很完美,成功运行,没有报错
然后稍微等一下就可以看到词云图了。
4.相关说明
参考链接:http://blog.csdn.net/Lee20093905/article/details/79052795
wordcloud的项目主页兼说明:https://github.com/amueller/word_cloud
wordcloud的whl文件:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
itchat 的项目主页:https://github.com/littlecodersh/itchat
itchat 的说明文档:http://itchat.readthedocs.io/zh/latest/
pandas的项目主页:https://github.com/pandas-dev/pandas
pandas 的说明文档:http://pandas.pydata.org/pandas-docs/stable/
matplotlib的主页:https://matplotlib.org/
题图:Photo byLauren PengonUnsplash
领取专属 10元无门槛券
私享最新 技术干货