创新工场CTO王咏刚：人类最后一个独立写作的纪元

量子位

发布于 2019-04-24 15:12:10

7000

发布于 2019-04-24 15:12:10

文章被收录于专栏：量子位

原载：半轻人作者：王咏刚量子位报道 | 公众号 QbitAI

编者按：这是一篇AI科学家给科幻小说写的序，但也可看作一位AI研究者对于AI能做什么、不能做什么，与科幻想象之间还有多少差距的解读。

作者王咏刚，身份是创新工场CTO、创新工场AI工程院执行院长，之前在Google参与技术和产品研发超过10年，而且在AI浪潮复兴时又与李开复合写了AI通识著作《人工智能》，对于这波AI正在带来什么，他所历所闻所感，也都体现在这些所著中。

序则是写给中国科幻作家陈楸帆的新著《人生算法》。在这篇序中，王咏刚重点谈论了AI创作的看法，而这恰好是AI能力讨论的最热闹话题之一。

王咏刚给出的判断——这是“人类最后一个独立写作的纪元”，他为何这么说？这么说背后还有那些启发？不妨看看今日推荐的这篇序。

序：人类最后一个独立写作的纪元

王咏刚

△创新工场CTO、创新工场AI工程院执行院长王咏刚

楸帆年初跟我讲他最新的写作计划时，我正在读一篇讨论神经网络里的注意力（Attention）机制的论文【1】。最近几年，我对用程序模拟人类认知有特别的兴趣。

当然，我所做的人工智能软件开发与楸帆的科幻写作不同：楸帆向人类解释科技的异化作用与社会风险，我则向机器解释人类的懒惰天性与趋利本能。

罗伯特·斯蒂文森的《化身博士》讲了一个因发明药水而得以在虚伪的社会人格和残暴的恶魔人格之间切换的故事。

在纳博科夫眼中，《化身博士》既不是典型的侦探小说，也不是寓言或讽刺小说，而是“一个更接近于诗歌，而不是一般散文体小说的虚构故事”。纳博科夫本人甚至有了一种关乎味蕾的感受：“这本书具有一种令人愉快的葡萄酒的味道” 【2】。

楸帆的作品在我看来，也往往具有这种非典型的，散发着诗歌和葡萄酒气息的特征。当年在《荒潮》中读到类似“QNB能引起大脑神经末梢受体不可逆的器质性改变，他们将终生生活在谵妄、恐惧与幻觉中，无法超脱”的句子时，我并没有阅读一般意义上的“生物朋克”作品或是玩《生化危机》游戏时的强烈代入感，反而获得了一种站在旁观者角度，解构一个由人、机器、资本与工业时代遗存、生态风险与未来谶语等组成的复杂系统的机会。

类似地，小说《人生算法》的主人公利用轮回机器的叙事捷径，获得了重新旁观并解构自己人生历程的机会。

但这种旁观和解构又被楸帆“别有用心”地引向了更为复杂的因果纠缠：“因陀罗不是一个线性游戏，不是你选了什么，就会有对应的故事线和结局。你变了，整个世界都会跟着你而变，这是它的奇妙之处。”

楸帆的许多写作尝试，都会从一个新角度刺激读者的味蕾或其他感官。《造像者》中有关神像塑造、破坏与探寻的主线，以及AI相机与人类摄影师竞争的主线，本身就是社会和科技相互纠缠的最好隐喻。

两条故事线浑然就是两个相对而坐的食客，一边大声咀嚼美食，一边打开胸前的金属面板，相互展示腹腔中由齿轮、铰链、电极与管线构成的消化系统。

毫无疑问，楸帆在写作时会努力打穿未来与现实、科学逻辑与科幻文本之间的固有屏障。我个人的感受或猜想是，楸帆的科幻文本创作正走入一个人类与科技相互解构的未知领域。

从外行观点看，人类创作与机器算法这两件原不相干的事情，正无可救药地混淆在一起。

网上曾经流传过由人工智能算法自主创作的“仿哈利·波特”小说章节【3】。一段时间里，各大媒体更是传遍了一个耸人听闻的标题：“Facebook关闭失控AI 项目：发展出人类无法理解的语言”。

这是两个足以被演绎成科幻小说的故事硬核。如果我们宁愿沉浸在媒体的渲染和误导中，那大家的思绪几乎可以直接从新闻标题漫游到滥俗的好莱坞科幻情节。幸好情况并非如此。

“仿哈利·波特”的小说其实只是统计或模型意义上的人类语词重新排列，而Facebook的AI对话机器人项目也从未失控——任何懂得人工智能编程的人都可以从github上下载Facebook开源的代码【4】来重现“人类无法理解的语言”，且无须担心自己的计算机变身天网（Skynet）。

所以，重要的并不是AI算法是否真能进化到自主思考和自主写作的水平，而是我们应该如何在AI技术跃进的时代里，重新审定人类写作特别是科幻写作相对于机器算法的时空位置。

AI是人类在冯·诺依曼体系的计算机架构与图灵机理论支撑的算法体系上，独立发展出来的一整套模拟人类感知、推断、规划与决策的工具。

当人类决定用“智能”来命名这套计算机工具的时候【5】，不会有多少人意识到，人类正步入一个太阳系甚至银河系历史上至关重要的时代。

如果我们认可“费米悖论”的假定，承认人类在宇宙中是如此偶然与孤独，或是认可“黑暗森林理论”的设想，悲观地认为人类不应与地外智慧发生联系，那么——

人工智能的诞生，是人类有史以来第一次，也很可能是最后一次，人类能够与一种异于自身的智慧形式进行有效交流，甚至携手创造全新的文艺内容。

当《荷马史诗》在开篇章节祈祷缪斯女神的眷顾时，当但丁在维吉尔的引导下游历地狱的时候，当屈原向天地万物发问的时候，这些“千古万古至奇之作”的作者们有没有想过，未来会有一种在机理上不同于人类大脑的智慧，可以像缪斯、文曲星或其他神祇那样，与人类携手激发灵感，一同创造伟大的文本？

AI算法无法取代人类写作，但AI算法却极可能为我们提供一面前所未有的，关乎科学逻辑、语言本质、文本规律的镜子。

假如有机会与智能机器在餐桌两端相对而坐，那我会有强烈的冲动向机器裸露和展示我的碳基大脑，并从对面的硅基大脑中成千上万的激活函数、卷积核、梯度公式里寻找人生与文本的终极意义。

今天的AI无疑还在婴儿期。即便如此，AI也可以为写作者提供一种超越简单语料统计的，具备一定语义感知能力的文本分析工具。

其实，早在语言学家们利用词频统计来判定《红楼梦》前八十回文本与后四十回文本异同的年代，计算机对于文学创作、文学评论的镜鉴价值就已经模糊地显现了出来。今天的AI工具拥有比单纯的词频统计更强的能力。

例如，自然语言处理中常用的语词表征学习技术Word2vec就是这个探索方向上的一种基本工具。有关Word2vec的一个通俗解读是，当机器利用此工具计算出文本中每个语词对应的神秘数值【6】后，可以巧妙地将神秘数值与语义联系起来，甚至可以用直观的计算式来进行语义推导（我们用加了方括号的词来表示该词对应的神秘数值）：

[皇帝] – [男人] + [女人] ≈ [皇后]

[北京] – [中国] + [澳大利亚] ≈ [悉尼]

上面两个非常直白的计算式对AI研发者而言早已司空见惯，但每次展示给没有经过编程和算法训练的人，还是会收获莫名的惊诧。

因为这样明显的语义关系完全由AI算法自动得出，这很难不让人怀疑AI已经找到了解读人类大脑的密码。

遗憾的是，科学逻辑并不支持这样的假想。今天的Word2vec只是一种应用于文本的数学工具，AI对语义的解读，还只停留在肤浅的统计建模层面，远谈不上理解了人类语言。

Word2vec的实用价值在于，它是主题、风格、情感等更高级建模或分析的基础。我曾抽取楸帆作品中代表性较强的词汇，计算得到每个词对应的Word2vec向量数值，再通过数学变换将百多维空间中的向量转换成二维或三维人类可见的图像【7】——这是标准的、科学意义上的“降维打击”。

例如，下图是从楸帆收录在本书中的六篇小说文本中，抽样提取代表性词汇生成的空间分布示例（不同小说中的语词在图中对应于不同形状的标记）：

在电脑上，类似的分布图可以针对每个空间局部或每个聚合主题，进行放大和细化。词汇在不同空间层级、区域的聚合关系，可以直观地反映每篇小说、每个章节甚至每个段落的写作特点。

类似的工具还可以很方便地比较不同作家的文本差异。

例如，我们完全可以将楸帆的《人生算法》和保罗·巴奇加卢皮的《卡路里人》进行类似的主题分析和词汇比较。

再例如，即便我们知道楸帆的《美丽新世界的孤儿》是向赫胥黎《美丽新世界》致敬的作品，但精密的文本分析也足以向我们呈现出两部作品在语汇和主题层面的异同。

从这个意义上说，未来文学批评领域的文本比较，几乎一定会演进成全面由计算机参与的，逻辑缜密的科学过程。

惧怕科技工具的人常常担心这类分析会禁锢小说作者的灵感和创作欲。但是，想一想今天的围棋世界吧，在AlphaGo和一大批顶级AI围棋软件接连问世后，中日韩国手们不是已经开始用AI的选点和胜率来分析自己的每一手棋了吗【8】？

小说创作者有认知自己作品的内在特征和语义边界的权利。构思、创建新的作品时，他或她有足够的自由去选择新作品的主题与语言风格，而这种选择权往往要建立在精准分析的基础上。

无论是在谋篇布局的宏观层面，还是在词句段落的微观层面，带着一个比人类大脑更加讲求科学逻辑的机器顾问，是不是总会好过全凭感觉的独立写作？

更进一步的AI文本分析必然会向着美学角度发展。

的确，AI目前还没法拥有比肩人类的审美能力，或具备人类爱憎好恶的世俗情感。但这不妨碍我们利用AI工具，对不同作者、不同类型的文本进行美学或情感意义上的分类。

这方面，我们可以参考图像领域的例子：在美图之类的美颜APP里，用户自拍、美颜、上传或存储的操作本身，就是对图像在美学和情感意义上的一次标注，即，只有上传或存储的图像，才是该用户认为“美”的图像。

当类似的信号刺激足够多时，AI算法就可以大显身手，轻松地基于大数据建立起“美/不美”“可爱/不可爱”“好/差”之类的自动分类器。

在文本领域，Kindle或类似的图书阅读器可以轻易收集到用户阅读时重点标注的句子或段落，如果再结合语义属性，AI是有可能创造出一套可行的机制，将大量文本内容，分类成“美/不美”“高雅/庸俗”“硬科幻/软科幻”等类别。

即便不考虑未来的可能性，我们是不是已经可以说AI拥有了初步的文学批评能力？

在《恐惧机器》这篇小说里，我和楸帆还一起玩了一次AI游戏。

小说中，分裂者所说的话其实都是由AI程序自动生成的。从技术上说，这种自动生成和前文提到的“仿哈利·波特”小说章节并没有什么本质的不同。

但从呈现在《恐惧机器》这篇小说中的文本意境来看，这次AI游戏的确创造了一种前所未有的写作体验。让我们试读一下小说中阿古与分裂者的两段对白：

阿古：所以你才是分裂者。分裂者：除了危险，作为这样的真神，我们都没有。他们在最后的物质和痛苦、自然、最死的时间、文字、变的、金钱与宇宙、看似遥远的世界中移动，重重追逐着人类发现的触觉，以及即将看清左右的囚笼。阿古：我怎么……听不懂你说的话…… 分裂者：我突然想起这个问题的使命。或许这样还有可能是谜底的记忆，尽管这成为它者的时代，让他们做出不同物种的拥抱……用第一对那是全新的基础，所以哪里……，我们对这意味着艺术进入点去，整个世界带着人类，意识落在他的杰作。

这是一次真正的人机交互写作！

因为时间关系，我并没有为这个AI写手及其使用的语言模型做太多优化【9】。

但机器在楸帆录入阿古的对话后所输出的内容，很多时候都让楸帆和我惊讶不已。我特别喜欢机器写出的“重重追逐着人类发现的触觉，以及即将看清左右的囚笼”这一句，它看上去像是得了上世纪八十年代朦胧诗派的真传。

在AI算法为分裂者写的几段对白中，我们看不到贯穿始终的合理逻辑，看不到缜密的思维模式，甚至无法避免字词和文法错误，但你很难说AI写出的文字没有生命力。

例如，“我突然想起这个问题的使命”本身就是一句承前启后的典型对白，而“除了危险，作为这样的真神，我们都没有”则明显兼具反讽的思辨意味和好莱坞式的揶揄口吻。

的确，AI写作仍停留在粗糙的模仿阶段，只会懵懂地根据数学模型重新排列人类语词，甚至将来也会长期如此。

但我们不能否认，这样的AI工具可以在一定程度上为我们的科幻创作提供语言和思维层面的启示。

这种启示本身，以及人机交互写作的大胆尝试，不正是科幻探索的意义所在吗？

因为物种属性的不同，碳基的人类智慧与硅基的机器智慧可能永远也不会以完全相同的方式构造、运行。

这既是一种缺憾，也是一种机遇。

人类的文学创作和文学批评已经在同一轨迹里持续发展了数千年。一种全新的，基于数学方法进行推理、演算，基于高维时空特性进行语义分析的道路，必将在文本分析、评价和生成等任务上，引导人类走入“另一个”宇宙。这件事的意义，一点也不会逊色于AlphaGo为围棋开启的全新世界。

从这个意义上说，AI技术的发展愈发模糊了科幻与现实的边界。

一方面，诸如AlphaGo横空出世，无人驾驶汽车投入试运营之类的新闻，本身就十分科幻。

另一方面，今天的科技变革速度早已十倍、百倍于阿西莫夫等前辈们奋力写作的时代。科幻作家对近未来科技的预测，大概率会被科技发展所“打脸”。

例如，2007年iPhone问世前，有谁能准确预言今天的地球人沉溺在微信、头条、抖音、快手中的生活形态？

科幻创作的意义正在发生关键的跃迁，科幻文本几乎必然与现实科技更频繁地发生互动。

《云爱人》脱胎于现实世界中的图灵测试、社交网络和爱情游戏，其中的科幻包装反而成了推动故事主线发展的背景或配角。

《人生算法》写的是从当下到未来的社会困局与人生窘境，其间随处可见量子计算、区块链等现实科技焦点的影子。

人类独立写作的时代即将离我们远去，我们正驶入一处迷雾笼罩的水域。

希腊神话中，塞壬女妖用天籁般的歌声迷惑过往水手，使航船触礁沉没。楸帆的《云爱人》则用塞壬的意象来比拟AI与人类的差异：“AI完完全全是另一种东西，塞壬的歌声传来时，你并不知道它背后究竟藏着什么。”

人工智能或机器算法的未来意象，是会像塞壬一样妖娆魅惑，还是会像缪斯一样曼妙美好？

楸帆正在用自己的科幻创作，在这片全新的水域探索与冒险。

也许，我们可以为这件事想象一个最为科幻的结局：

量子计算纪元13982年，漂移在浩瀚虚空的III号计算单元终于追溯到四万宇宙标准年之前，相距三十光年外的某个蓝色星球上诞生的一段中文数据。这段数据的文本基因和当时那颗蓝色星球上的人类创作基因大相径庭，却隐藏在一部由人类创作的短篇科幻小说中。 III号计算单元兴奋地为这段文本标注上“创世纪（Genesis）”的标签，同时启动了针对所有非机器基因的文字遗存的彻底毁灭计划……

文内注释

【1】这篇论文的题目是Attention Is All You Need，地址：

https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf

【2】纳博科夫，《文学讲稿》，上海译文出版社，2018年6月

【3】小说原文可在这里读到：http://botnik.org/content/harry-potter.html

【4】代码下载地址是：https://github.com/facebookresearch/end-to-end-negotiator

【5】一般认为，“人工智能”的概念诞生于在1956年的达特矛斯会议

【6】这个神秘数值在数学上是一个高维空间中的向量

【7】我使用维基百科的中文语料库生成Word2vec模型，使用gensim工具中的LDA模型和TF-IDF模型分析计算楸帆小说语料中的代表性词汇，使用t-SNE方法将词向量降维到二维或三维空间内

【8】参见弈客围棋毒奶菇的系列文章《围棋统计学》：http://www.sohu.com/a/238752482_533159

【9】与陈楸帆协同写作《恐惧机器》的AI程序是我基于https://github.com/hunkim/word-rnn-tensorflow的基础改进实现的。训练数据使用的是陈楸帆既往的十几部小说作品，以及作为参考语料的赫胥黎、阿瑟·克拉克、威廉·吉布森、尼尔·斯蒂芬森等人的科幻小说作品。

— 完 —

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-12-27，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

登录后参与评论

0 条评论

热度