他用机器学习预测权力游戏结局:龙妈小恶魔集体领盒饭?

HBO热剧权力的游戏

第、8、季

也是最后一季!

已经定档今年4月14日首播!

相信大家都很好奇,

谁将最终

坐上铁王座!

不管有没有看过GOT,

你应该都有所耳闻,

此剧最大的特色之一就是:

每季都死很多人,

死的全是主要角色,

而且根本猜不到下一个谁死

(Ned Stark之死,

被粉丝评为最令人意外的死亡Top1)

随着最终季定档,网友们也按耐不住,纷纷对剧中几位主人公的命运进行预测

一位来自美国的数据科学家,甚至通过机器学习算法,用model分析出“最终季,谁最有可能领盒饭”排行榜!

最有可能领盒饭角色Top3

这个预测准吗?

背后的依据又是什么?

让我们来看看这位数据科学家

是如何得出这个结论的。

Taylor Larkin简介

数据科学家。曾参与各种领域的机器学习项目和研究文章。Taylor毕业于阿拉巴马大学,获得商业分析博士学位和应用统计学硕士学位。

Taylor的数据库来自一个由GOT骨灰级粉丝倾力制作的百科全书(Wiki of Ice and Fire)。其中包括角色、家族、性别、贵族身份、年龄、已故亲属等各种信息。

具体分析如下:

01

探索性数据分析

Taylor首先调查了每个角色所属的家族和文化,头衔,性别,贵族身份,年龄,以及他们的亲属是否已经死亡。

在清理数据之后,他使用文本建模器(word cloud)进一步深入了解了哪些家族与死亡的联系更大

* 字号越大,家族人数越庞大;红字标记的家族与死亡联系大,蓝色标记的家族则相对安全。

我们看到,Targaryen家族是深红色,数据显示67%来自该家族的人物已经死亡。

这并不奇怪,因为Targaryens掌权时期遭遇了叛乱,导致了大部分族人的死亡。

至于Tyrell家族,他们的名字是深蓝色,数据库中只有大约5%的人物被标记为已故。

看到这里,一些粉丝可能会提出质疑:Tyrell家族在第6、7季电视剧中明明死了不少人啊?

这主要是因为,这些数据都是来自已出版的小说原著,而不是剧集。很多前两季电视剧中发生的大部分情节,都发生在还未出版的冰与火之歌小说第六部《凛东的寒风》里。

再看一眼性别分析,我们可以发现,不仅书中的女性角色较少,而且与男性相比,它们的死亡频率也较低。这是因为书中参与战斗的角色主要以男性为主。

02

分析和特征选择

通过特征选择,Talylor列出了影响角色幸存与否的几个重要因素,按先后顺序排列分别是:

1) 所属家族

2) 年龄

3) 是否有死亡亲属

4) 性别

为了进一步探索死亡概率与以上几个因素的确切关系,他使用了一种称为partial dependence的分析方法。该分析法与标准的基于线性的方法(如regression)相比,能够更轻松地捕获数据中的非线性效应。

以角色的年龄为例:

黄线表示当保持其他因素不变,仅改变年龄值时,死亡概率会如何变化。

在确定了以上几个主要影响角色死亡概率的因素之后,就可以开始训练模型,预测结果了。

03

调用模型

在调用模型时,Taylor使用的是一个名为DataRobot的机器学习平台。

DataRobot可以帮助研究者选择机器学习算法,对于每个算法该平台都会构建一个blueprint(如图),自动优化该特定算法的数据。

为了产生更准确的预测,这个blueprint将3个模型混合使用。在这种情况下,预测的结果会比三者中的任何一个独自产生的结果具有更高的准确度

04

结论

最后,在以上机器学习算法的帮助下,Taylor得出了各个主角的预测死亡概率,以及为什么做出预测的前三个原因(如下图)。

* 红色表示那些增加死亡概率的因素,

蓝色表示降低死亡概率的因素。

通过分析我们发现:

1. 大部分角色被预测死亡的最重要原因是他们都有已故的亲属,这也从侧面体现出某个家族的动荡历史。

2. 在“northmen”文化下成长的主人公似乎风险相对较小,而“valyrian”文化影响下的人物则具有相反的效果。

3. Lannister的兄弟姐妹,Jaime,Tyrion和Cersei都有更高的死亡概率,部分原因是年龄较大。

4. 正如探索性数据分析阶段所见,男性本身就更具风险。

5. 在列出的十个人中,龙母死亡的概率最高,而前国王Robert的私生子Gendry的死亡率最低。

不过对于这样的结果,

Taylor本人表示:

如果想仅仅用机器学习就预测出

那些令人目瞪口呆、九曲十八弯的情节,

那就未免有点小看这部神剧了...

不管吃瓜群众预测地多么热火朝天,

最后维斯特洛大陆上茫茫众生的命运,

还是编剧和导演说了算...

至于剧情最终走向如何,

还是让我们一起静候最终季的到来吧!

E/N/D

Source: https://blog.datarobot.com/predicting-death-in-game-of-thrones

也想做这么有意思的data项目?

想成为一名data scientist/analyst?

人工智能与数据科学强化课程

2月13日,免费试听!

课程项目

一门课程,三倍资源!

报名学员可根据自己求职方向,

挑选合适的project动手实践、丰富简历!

关注公众号来offer网,

关注公众号来offer网,

关注公众号来offer网,

课程介绍

咨询方式

添加来Offer课程顾问为好友

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190205G093K000?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券