我们每天使用最多的软件应该就是微信了,那你有没有想过,我们每天的聊天记录里使用最多的词是什么,都有哪些情绪,最近是悲观还是乐观呢等等。
今天推荐的这个项目是「wechat_analysis」,用 Python 对微信聊天记录进行文本分析。
先整体预览一下整个项目结构:
具体步骤
1、导出聊天记录
2、生成词云
调用 generate_word_cloud.py。
3、计算情感得分均值,作折线图(使用 snownlp)
snownlp 得到的分值不一定准确,所以 send 和 receive 的得分值都差不多,但也有可能日常的交流就是比较中性的,没有什么大起大落的情感。
4、计算情绪分类,作热力图(使用大连理工情感词典)
调用 sentiment_dict.py;
注意第 115 行,如果没有匹配到任何情感词,就记为 None,绘制热力图的时候会筛掉 None 的记录。
地址:https://github.com/saturn-opposition/wechat_analysis
更多功能广大网友可以继续挖掘。