【AI万圣节】MIT发布首个AI鬼故事作家,RNN和在线学习算法生成恐怖小说

【新智元导读】继去年“机器学习生成恐怖图像”后,MIT研究人员在今年的万圣节推出了“AI写恐怖故事”的项目,利用RNN和在线学习算法,结合Reddit上人类写的恐怖故事资料,生成恐怖故事,生成的句子包括“它的皮肤冰冷苍白,好像在我的肺里来回移动,试图留在我的灵魂里”。人会被AI写的故事吓到吗?一起来看。

万圣节来了。但今年的万圣节有些不一样。

MIT媒体实验室的一个研究团队设计了一个叫Shelley的AI恐怖故事作家。

据MIT Media Lab官方介绍,Shelley是一个由深度学习驱动的AI,“自小”就在Reddit NoSleep上阅读原创恐怖故事。现在它长大了,在随机的一小段文字中获得灵感,就能创作令人毛骨悚然的故事。研究团队也鼓励人们与Shelley互动,续写Shelley在推特上写的恐怖故事。

Shelley的名字源于英国作家Mary Shelley。Mary Shelley曾创作了第一部科幻小说《弗兰肯斯坦》。

今年10月21日,Shelley正式在推特上线,用户名是@shelley_ai。Shelley每小时就会在推特上写一个新的恐怖故事的开头,并以#yourturn(#该你了#)的话题标签邀请人类续写,然后Shelley会回复人类的续写,如此循环往复。如下图所示:

如此,人和AI合作写出了诡异却不失趣味,且不可预测的恐怖故事。这展现了创意与合作的特征。

“它的皮肤冰冷苍白,好像在我的肺里来回移动,试图留在我的灵魂里”

到目前为止,Shelley官网上已收录了99个完整的恐怖故事。

以Standing in the Woods这个主题为例,官网共收录了7个不同版本的故事,共有11名推特用户参与,发布的推特数有37个。

我们来欣赏一篇由Shelley与推特用户合作写出的恐怖故事:

译文:我从窗户外望出去,看到一个男人站在树林里。我吓傻了,然后追着他跑。我跑啊跑啊,突然意识到他根本不是一个人。而是某种更可怕的东西。它停下来,回头盯着我,呼吸喷在我的喉咙上。它很高,是一个没有面部特征的黑色人形生物。我不明白它为什么总是盯着看。我醒悟得太晚了,它在试图进入我的大脑。一个可怕的外星人般的声音充斥在我的脑袋里。我无法再跑。那一刻,时间似乎好像凝固住了。我感觉到有什么东西在挠我痒痒,一种永不停止的灼烧感。现在,我理解了它的目的:不仅要杀死我,还要抹除一切我存在过的印记。我无法移动,盯了它一会儿,感觉到它的皮肤冰冷苍白,好像在我的肺里来回移动,试图留在我的灵魂里。它逐渐占据了我的身体。我能感觉到它外星人般的存在。它选择了我,成为它的寄主。我感觉到它抬起了我的身体,接下来会发生什么?我很害怕。我看着我的“身体”在空中漂浮了13秒。在我最后残存的意识里,我为世界感到遗憾,因为世界即将终结。而我,作为外星人族群的一员,感到无比自豪。

RNN与在线学习算法的结合:AI讲的恐怖故事能吓到我们吗?

研究人员通过Reddit NoSleep网站上140000个原创恐怖故事来训练Shelley。

Shelley基于AI自有的学习数据库撰写恐怖故事的开头,此外通过回复人类的续写,增加了自己的知识库。

创造Shelley的研究团队有三人:Pinar Yanardag, Manuel Cebrian, Iyad Rahwan。Pinar Yanardag是这个团队的负责人,她说,“Shelley是多层次循环神经网络和在线学习算法的结合,可以随着时间的推移从人群反馈中学习。Shelley和人类协作越多,就能写出更多、更吓人的故事。”

Pinar Yanardhag是MIT Media Lab的博士后,她的个人签名是“我爱数据”。根据她此前发表的文章,她一直在自然语言处理(NLP)及其应用方面努力,在NIPS、KDD、EMNLP会议发表论文,提出了“Deep Graph Kernels”(一个统一的框架,可以学习图的子结构的潜在表示)、将词嵌入视为排序问题的WordRank,以及比对图的亚模型框架。她2013年就做了微博数据分析(Understanding and Analysing Microblogs,DC at WWW 2013),并在去年做了在线社区Reddit数据调查(Where does the narwhal bacon?Diversityand Discoverability in Online Communities, KDD 2016)。这次的让AI在人类辅助下进行恐怖故事写作的项目Shelly,也是在此前的这些研究和调查基础上展开。

研究团队表示,“Shelley的创造性思维天马行空。她写的故事包括一个怀孕男子在医院醒来,地板上有一张冷静微笑的嘴,镜子里的无脸男等等。Shelley写的故事有无限种可能性!”

据研究团队介绍,Shelley项目是为了一窥对人类与AI关系的恐惧心理,希望能更多了解机器如何唤起人类的情绪反应。研究人员Iyad Rahwan在邮件中写到,“人工智能的快速发展使人们非常担忧,比如可能带来的大规模失业和邪恶机器人灭绝人类。以上是人工智能在抽象意义上吓到人类。但是,AI能(以讲恐怖故事等方式)吓到我们吗?”

该团队曾在去年万圣节推出一款Nightmare Machine(噩梦机器)——计算机利用人工智能深度学习算法和邪恶的灵魂生成恐怖的“闹鬼”(haunted)风格图片。

在去年的项目中,研究人员使用“最先进的深度学习算法,了解闹鬼的房子或者犯罪城市的样子。然后,将学习到的风格应用于著名的地标”,算法成功从喂给它的元素中提取出了“恐怖”的模板,并将其植入地标建筑。“大多数的结果看上去确实相当可怕。”

为什么是RNN?深度学习的基础模型之一

RNN无疑是深度学习的主要内容之一,它允许神经网络处理序列数据,如文本、音频和视频。 它们可以用于将序列编码至不同层级的理解(抽象层次不同的知识表示)、标注序列,甚至从头开始生成新序列。一个 RNN cell在处理序列数据时一直被重复使用,Share Weights。

RNN的核心特征是“循环”, 即系统的输出会保留在网络里, 和系统下一刻的输入一起共同决定下一刻的输出。

这一点符合著名的图灵机原理。 即此刻的状态包含上一刻的历史,又是下一刻变化的依据。 这其实包含了可编程神经网络的核心概念,即, 当你有一个未知的过程,但你可以测量到输入和输出, 你假设当这个过程通过RNN的时候,它是可以自己学会这样的输入输出规律的, 而且因此具有预测能力。

这里A被称作 controller(图中是在处理序列数据,有个错误,最后应该是x3,y3), 可以是FNNs(feedforward neural networks),也可以是RNNs,但RNNs能实现更多操作,因为它是 Turing Complete 的。

RNN在语言研究中得到广泛的采用。去年,谷歌就曾发布了一项名为“探索RNN极限”的研究,开源大规模语言建模模型库,含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。

AI会代替人类作家吗?

实际上,AI写小说已经不是新鲜事。去年,据日本朝日电视台报道,一篇由人工智能创作的小说在“星新一奖”的比赛中通过了初审,尽管这篇名为《机器人写小说的那一天》并未摘得最终奖项。

今年是该奖项自1981年设立以来,第一次碰到“非人类作者”。本次评奖中,共有1450篇小说参加,其中有11部是人工智能成果。所有作品必须经过四轮筛选,并且评审们并不知道哪些作品来自人工智能,哪些作品来自人类作者。经过第一轮后,东京立刻召开报告会,宣布由人工智能创作的短篇小说通过了文学奖的第一次评审。

原来,“利用人工智能进行小说创作”在日本大学中已经成为一个研究课题,日本公立函馆未来大学、名古屋大学、东京工业大学等纷纷组成团队,向文学奖评审团提交人工智能小说,以证实研究成果。

《机器人写小说的那一天》由日本公立函馆未来大学松原仁教授带领的团队提交,与MIT 的Shelly一样,整个写作过程并非由人工智能独立完成,还是需要人工设置好男女主人公、登场人物、故事梗概等,之后计算机再依据事先准备好的大量词句素材,选择使用,组合词汇,最终自动生成小说。在创作中,人工智能的作用占到20%,80%经过人类的编辑润色。

至于机器是否能真正取代人类作家,Iyad Rahwan说,“短期内,人类作家不必害怕。现在,AI算法能够生成高度结构化内容,如市场发展报告。也可以生成更为创意化的内容。但目前AI还不擅长生成复杂叙事。AI版的J.K.罗琳或斯蒂芬金出现还有待时日。但最后机器或许能够构建复杂叙事,探索科幻小说里的创新空间。”

一起来让Shelly写出更加恐怖的故事:http://shelley.ai/

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-10-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

李飞飞:我们怎么教计算机理解图片

前言: 当一个非常小的孩子看到图片时,她可以辨认出里面简单的要素:"猫""书""椅子"。现在,电脑也聪明得可以做同样的工作了。接下来呢?在这个令人震撼的演讲里,...

35480
来自专栏罗超频道

忘了黄金时代,理性看待大数据预测

在世界杯预测时准确率超高的百度大数据预测在稳步推进时遇到了一个小障碍,尚处于内测的票房预测对《黄金时代》的预测与实际结果出现了偏差,被媒体长篇报道引发业内高度...

35940
来自专栏Vamei实验室

统计Go, Go, Go

结束了概率论,我们数据之旅的下一站是统计。这一篇,是统计的一个小介绍。 统计是研究数据的学科。它包括描述数据,推测群体信息,判断假设的真伪。统计是一门实用学科。...

19190
来自专栏大数据文摘

用机器学习的经验指导人生:如何实现学习效率最大化

12630
来自专栏机器之心

深度 | 从规则推理到数据学习:人工智能该学习人类的思维方式吗?

16380
来自专栏IT派

图像 | 视频换脸技术,女神都下海了吗?

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 最近,美国闲散人士论坛 Reddit 上有个神奇的 18 禁板块,专门分享女明星 PS 的裸...

906100
来自专栏AI科技大本营的专栏

关于用AI搞金融这件事,瞎BB吹上天没用,听听实战的人怎么说

金融学理论和计算机技术的不断革新,带来了基于数据处理与数据分析的量化投资策略的蓬勃发展,量化模型成为了预测市场和指导投资的有力工具。然而证券市场是一个复杂的非线...

32180
来自专栏新智元

斯坦福医疗ImageNet发布,如何评价PB级医疗影像数据集?

【新智元导读】斯坦福大学医学院与 Langlotzlab 合作创建的一个 PB 级的大型医疗影像数据集 Medical ImageNet 最近发布,从官方网页的...

49170
来自专栏PPV课数据科学社区

人工智能革命:为什么深度学习会突然改变你的生活?(上)

? 编者按:过去4年,大家无疑已经注意到大范围的日常技术在质量方面已经取得了巨大突破。这背后基本上都有深度学习的影子。到底什么是深度学习?深度学习是如何发展到...

38180
来自专栏机器之心

特写|人工智能背后的人

机器之心原创 作者:虞喵喵 在大部分人看来,人工智能是个有些「科幻」的词汇,代表小说电影中和人类长相相似、或温柔或冷酷的机器人。 稍微熟悉一点,这份印象又变成冷...

42980

扫码关注云+社区

领取腾讯云代金券