《权力的游戏》探索性分析

群内不定时分享干货,包括最新的python企业案例学习资料和零基础入门教程,欢迎初学和进阶中的小伙伴入群学习交流

一:简介

《权力的游戏》(Game of Thrones),是美国HBO电视网制作推出的一部中世纪史诗奇幻题材的电视剧。该剧改编自美国作家乔治·R·R·马丁的奇幻小说《冰与火之歌》系列。该剧成功塑造成千上万形象饱满的人物角色、怪诞独特充满想象的风土人情,其空间之完整、细节之丰富、叙事之恣意让人感叹!现在让我们用数据分析的方式看一看这个残酷的世界!!(本文所使用的数据集来自Kaggle网站,使用Python进行分析,当然你完全可以用R!!)

二:数据集介绍

该数据集包含了三个CSV文件,分别是:battles.csv,character-deaths.csv和character-predictions.csv。现分别介绍如下:

battles.csv:《权利的游戏》中所有的战争。

character-deaths.csv:人物死亡数据集。

character-predictions.csv:人物命运预测数据集。

在每一个CSV数据里面都包含了大量的变量,读懂这些变量名所代表的含义非常有必要。例如:battles.csv中的year变量代表战争发生的时间,battle_type代表战役类型,有伏击战,围攻战,突袭战等。

三:导入所需模块并加载数据集

导入数据集

battles = pd.read_csv('C:/Users/WaJueJiPrince/Desktop/Throne/game-of-thrones/battles.csv')character_deaths = pd.read_csv('C:/Users/WaJueJiPrince/Desktop/Throne/game-of-thrones/character-deaths.csv')character_predictions = pd.read_csv('C:/Users/WaJueJiPrince/Desktop/Throne/game-of-thrones/character-predictions.csv')

四:数据探索性分析

那个区域拥有最多的战争

战争类型的比较

可以看出对阵战最多,攻城战次之

那位国王好战呢?!!

那位国王被攻击最多呢?

主要人物的死亡与被俘事件/根据年分组

军队实力对于战争结果的影响

蓝色代表进攻方失败,图中右下角以少胜多,不知道这场战役是怎么打的??

不同国王的军队里面有多少指挥官,红色线代表均值,五角星代表异常值

相关性可视化

主要可视化的是character-deaths.csv数据集和character-predictions.csv数据集。

(如果图片看不清,请在新标签中打开!!)

从相关性图中可以看到一些符合“感觉”的关系,比如《权利的游戏》与《冰与火之歌》第一册的相关系数达0.86。

五:结尾

本文旨在抛砖引玉!因为我从未看过《权力的游戏》!(严格来说看过开头大概20分钟吧!)。在分析的时候“深感无力”,因为数据分析本来就是建立在对业务或者项目熟悉的基础上!所以本文的分析严重欠缺美剧知识!分析不足之处还请见谅!!!

关于作者:

姓名:麦艳涛

网名:挖掘机小王子

个人网站:挖掘机小王子

转自:

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171222A0SSJ800?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券