抖音视频数据可视化从 0到1

先看如下可视化图表(双击图片放大):

感觉如何,想知道如何生成的吗,跟我操作,包你 30 分钟轻松拿下。

一、数据抓取

前段时间抓取了 2.27w 项抖音视频数据(回复抖音,下载原始数据)。

可以给大家分享下抓取思路:

目前已经有很多爬虫在抓取抖音数据了,与其自己劳神破解,直接从别人爬取结果中提取数据岂不更简单易行?

二、数据 清洗 & 处理

2.1 数据清洗

如下图,「数据」 -> 「删除重复值」 -> 根据「视频链接」字段去重即可。去重后剩余 16482 项数据。

2.2 字段拆分

需将提交时间拆分为年、月、日、时、分、秒 6 个字段。操作步骤如下:

1、在提交时间后预留 5 个空列,以防拆分后覆盖其他数据。依次选中「提交时间」列 ->「数据」 -> 「分列」。

2、选中「固定宽度」。

3、建立分列线。

4、设置数据格式。

5、完成后效果如下。

2.3 去处冗余

综合运用 分列 & 函数(SUBSTITUDE)去除「作者」列的『抖音』及『的视频』,「描述」列的『简介:』,结果如下:

此时 数据清洗 及 后期处理 已完成,下一步可进行数据可视化操作。

三、数据可视化

3.1 软件安装

此处使用的软件是 Tableau Desktop,可在其官网免费下载,试用期 15 天:

https://www.tableau.com/zh-cn/products/desktop

3.2 导入数据 & 前期设置

1、如下图,选中刚处理过的 Excel 表格并导入。

2、点击工作表标签,对左侧字段简单分组。

3.3 抖音 24 小时播放、点赞、分享、评论数分布

如下图将相应字段拖拽入坐标栏并调整顺序,然后双击并修改文本标签即得。

3.4 抖音创作者排名

3.5 抖音视频排名

教你一招:选中「作者」、「播放数」、「点赞数」,单击右上角「智能显示」,可选软件根据情境推荐的合适图表。

好了,文章开头的 3 个可视化图表均已完成,回头一看,是不是 so easy 啊?

四、其他

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180421G1G6IO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券