前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >震惊!垃圾分类居然能用Python搞定!

震惊!垃圾分类居然能用Python搞定!

作者头像
公众号---人生代码
发布2019-07-24 14:47:53
8140
发布2019-07-24 14:47:53
举报
文章被收录于专栏:人生代码人生代码

震惊!垃圾分类居然能用Python搞定!

1 环境

操作系统:Windows

Python版本:3.7.3

2 需求分析

我们先需要通过

拿到 cid 之后,再填入下面的链接中。

http://comment.bilibili.com/{cid}.xml

打开之后,就可以看到该视频的弹幕列表。

有了弹幕数据后,我们需要先将解析好,并保存在本地,方便进一步的加工处理,如制成词云图进行展示。

3 代码实现

在这里,我们获取网页的请求使用 requests 模块;解析网址借助 beautifulsoup4 模块;保存为CSV数据,这里借用 pandas 模块。因为都是第三方模块,如环境中没有可以使用 pip 进行安装。

代码语言:javascript
复制
pip install requests

pip install beautifulsoup4

pip install lxml

pip install pandas

模块安装好之后,进行导入

代码语言:javascript
复制
import requests

from bs4 import BeautifulSoup

import pandas as pd

请求、解析、保存弹幕数据

接下来,我们就对保存好的弹幕数据进行深加工。

制作词云,我们需要用到 wordcloud 模块、matplotlib 模块、jieba 模块,同样都是第三方模块,直接用 pip 进行安装。

代码语言:javascript
复制
pip install wordcloud

pip install matplotlib

pip install jieba

模块安装好之后,进行导入,因为我们读取文件用到了 panda 模块,所以一并导入即可

我们可以自行选择一张图片,并基于此图片来生成一张定制的词云图。我们可以自定义一些词云样式,代码如下:

接下来,我们要读取文本信息(弹幕数据),进行分词并连接起来:

最后来看看我们效果图

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CryptoCode 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 震惊!垃圾分类居然能用Python搞定!
    • 1 环境
      • 2 需求分析
        • 3 代码实现
          • 模块安装好之后,进行导入
            • 请求、解析、保存弹幕数据
              • 接下来,我们就对保存好的弹幕数据进行深加工。
              相关产品与服务
              腾讯云图数据可视化
              腾讯云图数据可视化(Tencent Cloud Visualization) 是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,全图形化编辑,快速可视化制作。腾讯云图数据可视化支持多种数据来源配置,支持数据实时同步更新,同时基于 Web 页面渲染,可灵活投屏多种屏幕终端。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档