第三天:诗词创作AI“九歌”

上一期的预告中,相信大家都见识了人工智能诗人“九歌”的出色创作能力。究竟“九歌”是如何创作出如此自然优美紧扣主题的诗词呢?今天,我们跟随“九歌”的缔造者之一、来自清华大学的郭志鹏教授一探究竟。

讲座现场

讲座初始,教授为我们首先讲述了“九歌”是什么。

“九歌”这一名字源于我国伟大诗人屈原的诗篇《九歌》,是清华大学自然语言处理与社会人文计算实验室研发的人工智能诗词创作系统(也就是一位AI诗人~)。在2017年,参加了央视节目“机智过人”并成功让观众以为它的诗篇是人类创作的(即通过图灵测试)。然而,尽管它作诗的句式押韵均符合要求,但句意及逻辑仍有缺陷。因此,在某些情况下,我们仍然可以清楚的分辨这些诗词并非人类创作。

接下来,教授为我们阐述了研发“九歌”的缘由。

简要说来,分为两点:一是研究人工智能技术;二是开发与围棋不同的另一种认知任务。相信大家都知道AlphaGo人工智能下围棋的事情吧:下围棋对人工智能的要求可谓非常高;然而创作诗词可谓是更加困难。借用教授在讲座上提到的例子,我们来进行一下简单的计算:围棋情况的总量是3^(19*19)=2^572(2的572次方);假设汉字集含1万个字,那么创作一首七律诗的情况便是10000^56=2^744(2的744次方)的运算量。从中不难看出要想让人工智能写诗,挑战着实堪比下好围棋。

对“九歌”开发难度的讲解

然后,便进入了技术的讲解部分~

“九歌”采用了最新的深度学习(Deep learning)并使用超过30万首诗歌进行训练学习。与此同时,它还结合诗歌本身的特点针对性地结合了许多其它的模型。

在开发初期,它采用了使用注意力(Attention)机制的Encoder-Decoder模型:根据诗词里的一句话顺序逆序结合生成特征值(词向量),来“理解”诗文上句的含义并“预测”下句。

然后团队对模型进行了一些修改与扩增。风筝模型(Kite string) 使得创作的所有内容前后呼应扣主题牵起主线;之后又有了基于互信息的无监督模型和模拟人类作诗过程的工作记忆模型,这样,这位聪明的“诗人”的创作水准便更上一层楼!

目前,“九歌”可以创作集句,即截取前人诗句拼集而成一诗。可集一家诗句,亦可集数家诗句而成。此外,“九歌”也可以创作藏头诗以及词。

未来,下一步的目标便是教给“九歌”背景知识,让它能够借助外部的其它知识来更好的作诗。

撰稿:霍岱宣 刘泽禹 李佳泰 赵俊宁

摄影:田嘉槐 倪朴弘

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20181025G000D300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券