前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >被“词云”包围的冰冰会更好看吗?安排

被“词云”包围的冰冰会更好看吗?安排

作者头像
朱小五
发布2021-02-05 10:52:12
4800
发布2021-02-05 10:52:12
举报
文章被收录于专栏:凹凸玩数据凹凸玩数据
大家好,我是小五?

昨天「凹凸数据」发了一篇张同学投稿的文章《用Python爬取王冰冰vlog弹幕并制作词云》。发现评论区有一些关于词云的建议,小五决定再安排一下~

爬取弹幕

本来想找张同学要一下弹幕数据,后来一看时间太晚了,干脆自己爬一下算了。

直接利用bilibili_api这个现成的轮子:

爬虫代码

上图代码可爬取到2000条实时的弹幕,至于评论区所问的历史弹幕怎么爬?实际上bilibili_api这个库也提供了参数可以实现,这次就不展示了,如果大家特别感兴趣,可以给本文一键三连,后面单独出一篇介绍本模块。

解决办法:

关于历史弹幕的参数

词云 01

成功获取了2000条弹幕后,先用我最近一年特别喜欢的——stylecloud模块来制作:

代码语言:javascript
复制
def ciyun(data):
    df = pd.read_csv(data, header=0,encoding='utf-8').astype(str)
    df['text'] = df['text'].apply(filter_str)
    text1 = get_cut_words(df.text)
    name = data.strip('.csv')
    print(name)
    stylecloud.gen_stylecloud(text=' '.join(text1), collocations=False,
                          font_path=r'‪C:\Windows\Fonts\msyh.ttc',
                          icon_name='fas fa-square',
                          size=600,
                          output_name='冰冰.png')

还阔以嘛

不过今天的目的是实现冰冰被词云包围,那就还需要修改一下蒙版!

词云 02

首先,按照建议,我反向抠出了背景图片。为了能均匀填充词云,小五又将其背景颜色全部改为黑色。

利用Python生成词云,这里做过太多次了,省略过程直接看词云成品。

效果很理想

最后,再用PS简单叠加一下图层就ok啦!

那么,被词云包围的冰冰变得更好看了吗?

看在冰冰的面子上,给个三连吧~~~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 凹凸数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 爬取弹幕
  • 词云 01
  • 词云 02
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档