python 生成18年写过的博客词云

回看18年,最有成就的就是有了自己的 博客网站,坚持记录,写文章,累计写了36篇了,从一开始的难以下手,到现在成为一种习惯,虽然每次写都会一字一句斟酌,但是每次看到产出,内心还是开心的,享受这样的过程。

这篇文章就是用python 生成自己写的博客词云,平常写的博客都是markdown 格式的,直接把文件传到后台,前端用js去解析文件显示的,所以我这里处理数据就不需要去爬虫网站,直接读文件处理的。

markdown文件处理,遍历文件夹,匹配md 后缀的文件,读文件,这里的 是文件夹的绝对路径。

得到所有的文本之后,使用结巴分词 ,处理成单个的词语。

因为平常写的文章里有很多的代码,这里可以正则只留下中文,然后再处理中文字符。

最后就是生成词云,采用的库

最终的结果显示图,除去代码之后,看这些词,不少还是跟android相关的,也是平常经常会提到的词汇。

欢迎关注我的个人博客:https://www.manjiexiang.cn/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190113A0GQ4600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券