祈年文潭：我们身处一个人机共生的时代，语言生活也不例外

文章来源：企鹅号 - 光明时评

作者：饶高琦

今年2月，OpenAI发布了拥有15亿参数的大规模无监督语言模型GPT-2，它擅长处理语言建模和文本预测任务，还具备阅读理解、总结、翻译等能力。只要给出一个开头的句子，GPT-2就能生成一篇小文章、一则新闻故事。“文思泉涌”的AI写作令人惊艳。

让计算机能说会道一直是人工智能最重要目标之一。随着深度学习技术的发展一日千里。机器写作曾经只能基于语言规则集和“话套子”在受限领域中进行“八股文”式的受限写作：比自动填表向前迈出一步而已。而今通过对海量规模互联网文本的深度分析，模型已经可以从大数据里捕捉越来越多的语义信息和语言使用中的规律，再配合以语体和领域的外部知识，能够写诗填词也就不奇怪了。甚至最近，国际著名学术出版集团斯普林格还出版了世界上第一本机器写作的专业技术书籍。

然而我们必须正视机器可以写作，但远不能创作的现状。而且距离可以创作的“强人工智能”还有极其漫长的距离。统计机器学习和深度学习都依赖现有的语言数据和依附其上的语言标注信息来获得浅层语义。但大数据的规模红利让这种浅层语义也能发挥巨大的功用。从而形成“文思泉涌”的效果：可细读起来，不知所云的句子却比比皆是。因为当前人工智能无法进行抽象和推理，真正意义上的新表达，新知识是无从创造的。

不过有一分技术，做一分事。不会创作的AI是为减少重复劳动，加速新闻生产，娱乐大众而诞生，并非要去抢夺中文系、新闻系毕业生的饭碗。技术的局限，不是技术的错误。不论是机器写作，还是已经多轮炒作的机器翻译，科技进步有其内在规律，专业领域之外的思考更多应集中于如何把好技术用好，用在合适的场景上，并为其最大程度上发挥功用创造条件。

我们身处一个人机共生的时代，语言生活也不例外。在个人层面上是用户和机器辅助写作的各种应用之间深度融合，而达到不自知的程度（正如输入法软件在我们身边的隐形角色）。在公众层面上则是用户的交流对象中，机器越来越多。据统计当前互联网上，近三成的流量是机器人产生的，并逐年增加。社交机器人在干预舆论中的作用越来越大。随着机器在语言生活中比重增大，问题也越来越多。由于机器写作几乎为0的写作成本，虚假评论、垃圾信息、污言秽语在机器写作的放大功效下产生了更大的破坏力。快速演进的技术每天都在叩问社会：机器写作作品的版权归谁？错误内容的责任如何归算？社交网络中的机器人是否必须亮明自己的“非人”身份？机器写作的作品是否需要和转基因产品一样，必须打上“非人”标签？诸如此类，不胜枚举。这些都是伦理和法律必须回答的问题。人类在AI的狂飙突进不能回避责任，于工业界当自律，于公众当理性，于政府则当在规范标准和法律上有所作为。

对了，本文由人类作者完成，除输入法外，绝无AI辅助……

（作者系北京语言大学助理研究员）

发表于: 2019-05-172019-05-17 15:07:36
原文链接：https://kuaibao.qq.com/s/20190517A0D20V00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

祈年文潭：我们身处一个人机共生的时代，语言生活也不例外

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐