专栏首页凹凸玩数据被“词云”包围的冰冰会更好看吗?安排

被“词云”包围的冰冰会更好看吗?安排

大家好,我是小五?

昨天「凹凸数据」发了一篇张同学投稿的文章《用Python爬取王冰冰vlog弹幕并制作词云》。发现评论区有一些关于词云的建议,小五决定再安排一下~

爬取弹幕

本来想找张同学要一下弹幕数据,后来一看时间太晚了,干脆自己爬一下算了。

直接利用bilibili_api这个现成的轮子:

爬虫代码

上图代码可爬取到2000条实时的弹幕,至于评论区所问的历史弹幕怎么爬?实际上bilibili_api这个库也提供了参数可以实现,这次就不展示了,如果大家特别感兴趣,可以给本文一键三连,后面单独出一篇介绍本模块。

解决办法:

关于历史弹幕的参数

词云 01

成功获取了2000条弹幕后,先用我最近一年特别喜欢的——stylecloud模块来制作:

def ciyun(data):
    df = pd.read_csv(data, header=0,encoding='utf-8').astype(str)
    df['text'] = df['text'].apply(filter_str)
    text1 = get_cut_words(df.text)
    name = data.strip('.csv')
    print(name)
    stylecloud.gen_stylecloud(text=' '.join(text1), collocations=False,
                          font_path=r'‪C:\Windows\Fonts\msyh.ttc',
                          icon_name='fas fa-square',
                          size=600,
                          output_name='冰冰.png')

还阔以嘛

不过今天的目的是实现冰冰被词云包围,那就还需要修改一下蒙版!

词云 02

首先,按照建议,我反向抠出了背景图片。为了能均匀填充词云,小五又将其背景颜色全部改为黑色。

利用Python生成词云,这里做过太多次了,省略过程直接看词云成品。

效果很理想

最后,再用PS简单叠加一下图层就ok啦!

那么,被词云包围的冰冰变得更好看了吗?

看在冰冰的面子上,给个三连吧~~~

本文分享自微信公众号 - 凹凸数据(alltodata),作者:朱小五

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-01-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python爬取 201865 条《隐秘的角落》弹幕,发现看剧不如爬山?

    如果你没看过,那可能会对朋友圈里大家说的“一起去爬山”、“小白船”、“还有机会吗”感到莫名其妙。

    朱小五
  • DataFrame(7):DataFrame运算——逻辑运算

    https://alltodata.cowtransfer.com/s/b8aa2f26ca0947

    朱小五
  • 对比MySQL学习Pandas的groupby分组聚合

    不管是mysql,还是pandas,都是处理像excel那样的二维表格数据的。对于一个二维表,每一行都可以看作是一条记录,每一列都可以看作是字段。

    朱小五
  • 机器学习之Python基础(二)

    标题 类 面向对象 装饰器 1 类 首先举一个创建类的例子 class是声明类的关键字,human是类名,括号里的object是继承的父类(在Python2中如...

    企鹅号小编
  • JAVA接入京东授权API

    如果您的应用已和京东JOS对接,需要获取一些与用户紧密相关的信息(如订单、商品、促销等),为保证数据的安全性和隐私性,需要取得用户的同意,引导用户授权。JOS采...

    凯哥Java
  • c#中jeson字符串和OBJECT对象的相互转换

    说明:首先,当然是项目是3.5+的;必须添加引用:System.Runtime.Serialization 和 System.ServiceModel

    小小许
  • DevOps工具介绍连载(39)——LeanKit

    LeanKit可以跨所有业务职能去实施精益原则、实践和工作方法,帮助公司创造持续改进和创新的环境,更快地为客户提供价值。通过在工作流程中可视化您的工作,Lean...

    小老鼠
  • Java基础练习之控制台练习

    1.要求使用java编程实现一个命令窗口程序,使得实现以下功能1.1 代码实现1.2 运行结果

    用户7886150
  • 十五道Python小案例,学会这些,Python基础已过关!

    分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满足条件的排列。

    QQ1622479435
  • 2017年十大技术突破之自动驾驶卡车

    麻省理工《技术评论》网站评选出2017年十大技术突破领域,自动驾驶卡车名列其中。《技术评论》预计自动驾驶卡车将在5到10年内得到广泛应用,并产生一些颠覆性影响。...

    人工智能快报

扫码关注云+社区

领取腾讯云代金券

,,