前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >可视化1300个故事 揭秘6种情节套路

可视化1300个故事 揭秘6种情节套路

作者头像
大数据文摘
发布2018-05-25 11:44:17
5690
发布2018-05-25 11:44:17
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘作品 转载具体要求见文末

作者| Marisa Krystian 选文|Aileen

翻译|行者 校对|肖文琪

伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。

◆ ◆ ◆

导言

人们天生喜欢去寻找并转述各类故事。我们所拥有的那种分享信息并定义自身存在性的能力就可以很好地解释为什么我们天生沉迷于此。

而现在,随着计算能力、语言处理和文本数字化三种技术方面的改善,以文字“大数据”来研究某种文化成为了可能。

正如美国作家库尔特·冯内古特(Kurt Vonnegut)曾经说过的那样:“这些故事都有着美丽而方便计算的格式,没有理由说我们不能把它们套进计算机的算法里去。”

图1 J.K.罗琳所著的《哈利·波特与死亡圣器》的情感线

(注:整个系列共七部书可以被定义为一个复杂的“杀死怪物”情节。数据分析:Hedonometer / Andy Reagan / Kirsch)

伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。

这项研究令人着迷的奇妙之处就在于首次提出了基本故事线的确存在的实验性依据,并由此解开了讲故事之所以能够吸引人们的本质特征。

◆ ◆ ◆

实验展示

科学家收集了1327本书作为样本,这些样本书绝大多数采用了收录进古登堡计划中的元数据来虚构故事(P.S.古登堡计划是于1971年发起的世界上第一个数字图书馆。其中所有书籍的输入都是由志愿者完成的)。为了生成样本书的情感线,研究者将文本分为了一个个10000的小块,并分析每个小块里的所表达的感情。(如图2所示)

图2

研究中所有样本书的故事线和相应的数据可视化如图3所示。

六种基本故事线形态分别为:

  1. “白手起家”(故事线主要特征形态为:上升)
  2. “悲剧”或“凤凰变麻雀”(故事线主要特征形态为:下降)
  3. “陷入困境的人”(故事线主要特征形态为:先降后升)
  4. “伊卡洛斯” (故事线主要特征形态为:先升后降)(P.S.希腊神话中代达罗斯的儿子。在用蜡和羽毛做的翅膀逃离克里特岛时,因飞得太高,双翼上的蜡遭太阳融化跌落水中丧生,被埋葬在一个海岛上。)
  5. “灰姑娘”(故事线主要特征形态为:先升后降再升)
  6. “俄狄浦斯”(故事线主要特征形态为:先降后升再降)(P.S. 俄狄浦斯是外国文学史上典型的命运悲剧人物。他在不知情的情况下,杀死了自己的父亲并娶了自己的母亲。)

图3 六种基本故事线的形态展示

(点击查看高清图片)

(注:从左至右从上到下依次为:“白手起家”、“陷入困境的人”、“灰姑娘”、“悲剧”、“俄狄浦斯”、“伊卡洛斯”。数据分析:Reagan et. al/ University of Vermont)

◆ ◆ ◆

结论

当研究团队确定了六种基本的情感故事线之后,又进一步观察了情感线与其故事下载量之间的关系,并据此探索最受欢迎的情感故事线类型。最终的研究结果显示,最受欢迎的故事往往遵循“伊卡洛斯”和“俄狄浦斯”两种类型的情感故事线。

另外,把众多感情线揉到一起的那些更复杂的故事同样受到追捧。事实上,研究结果显示,最受欢迎的故事往往是连续两次出现“陷入困境的人”的,还有“灰姑娘”紧接一个“悲剧”的故事。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-10-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档