专栏首页AI科技大本营的专栏人工智能写手,好用吗?

人工智能写手,好用吗?

作者 | 王树义

来源 | 玉树芝兰(ID:nkwangshuyi)

1、印象

之前给学生上课的时候,我介绍过利用循环神经网络,仿照作家风格进行创作的机器学习模型。不过,那模型写出来的东西嘛……

我的评价是:望之,不似人语。

因为这种限制,人们并没有把“机器写作”当成一回事儿。总觉得机器要写成那种以假乱真的高度,可能还需要等上很久远的一段时间。

然而,这世界变化快。

2、工具

早上,我尝试了一个新工具。

一个在线编辑器界面里,输入或长或短的一段话,然后按一下 Tab 键。

后面的内容,机器就帮你自动逐步填充。

填充的过程里,系统每次给你3个备选方案,这样你可以控制写作思路的走向。

当然,你也可以根本不管其他选项,一直走默认路径。机器照样文思泉涌。

最后生成的文章,是这个样子的。

其中,第一段落是我自己随便瞎写的。后面高亮段落,都是电脑模型自己编出来的。不但标点符号、语法修辞用得有鼻子有眼儿,就连我那段里根本没有提到过的创始人,都跳了出来长篇大论。

3、尝试

大家也可以通过下面的链接进行尝试,智能写作编辑器的链接:

https://transformer.huggingface.co/

不知道你尝试过后的感觉是什么。反正我觉得,以后学校里的英文写作课,怕是没有办法判作业了。原本需要学生花半个小时完成的任务,现在他可以轻点几下按键,就能搞定交差。更要命的是,从原理来讲,查重系统面对这种作品,是无效的。

因为这并非抄袭。机器每一次的“创作”,几乎都能保证是全新的。

4、原理

你一定想知道这背后的原理吧?其实,在我们之前的教程里,我多次给你介绍过它。就是目前最火的自然语言模型架构——Transformer。

(上图来自于经典之作“Attention is All You Need”)

我们详细介绍过使用方法的 BERT ,当初用的就是这种技术,才产生了野蛮霸榜的效果。不过咱们用的这个编辑器,底层并不是 BERT ,而是我们之前提及的 GPT 2。

大多数人提到它的时候,介绍往往不是那么正面。并不是因为 GPT 2 这种技术不够好。而是因为它“太好了”。好到足够让人眼馋。好到开发者决定,不开放训练数据集、代码、甚至模型参数……

要知道,在当今这样一个开源开放的趋势下,这么做会招致多少非议。当时 OpenAI 做出这种决定和解释,有人便认为是出于饥饿营销的目的,赚眼球。但是,你刚刚自己尝试过语言生成模型的威力之后,还会保持这么单纯的想法吗?

5、威胁

仅举一例。互联网上,假新闻是一个非常严重的问题。原先,用机器造假新闻出来,成本固然低,但专业人士还是很容易通过语言特征和统计规律来识别的。

而一旦,假新闻不但生产成本低廉,分分钟可搞定,还完全具备了真新闻的语言特征,要分辨出来,就不容易了。假新闻有可能多点大规模爆发,因从众和沉默螺旋等社会心理机制,对大众轻易造成误导。

面对这种潜在威胁,我们真的已有完善的应对之策吗?正因为这种威胁实际存在,数据伦理才愈发成为重要的研究课题。

如果你做数据科学研究,这个方向大有可为。

6、魔盒

风险是显著的。而技术的进步与发展,真的能够因为一家机构决定“不开放模型”的举措,就能停滞吗?

当然不会。OpenAI 因为压力,不断释放出更为强大的开源模型。目前开放的预训练模型版本,达到了 774M 个参数。距离完全版本模型的释放,也就是临门一脚的事儿了。

曾经,普通人即便拿到了这种开源工具,也需要一定的门槛,才能使用。

然而“有好事者”,在整合包装了若干种主流的 Transformer 模型之后,降低了 GPT2 机器写作的门槛。于是,就有你看到的这个编辑器了。

7、波澜

我把 GPT2 自动写作的结果,发到了朋友圈。

(图来源于作者发布的朋友圈)”第一段落是作者自己随便瞎‌写的。后面高亮段落,都是电脑模型自己编出‌来的。不但标点符号、语法修辞用得有鼻子有‌眼儿,就连我那段里根‌本没有提到过的创始人‌,都跳了出来长篇大论‌。"

惊艳之余,小伙伴想到的,主要是以下两个问题:

  • 什么时候出中文的?
  • 能否和写字机器人配合使用?

我看后很无语。好在这一位的留言,让我看到了光明的一面:

以后英语老师出阅读题,可方便多了。

本文分享自微信公众号 - AI科技大本营(rgznai100)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 开源软件的商业模式演变分析(二)

    开源软件在几十年前刚起步发展时,最主要的理念是打破闭源软件公司的垄断,也就是Microsoft、Apple、IBM等这些闭源软件公司,期望让所有人都能无条件使用...

    用户5997198
  • 盘点性能最强的One-stage目标检测算法

    要知道衡量目标检测最重要的两个性能就是 精度和速度,特指 mAP 和 FPS。其实现在很多论文要么强调 mAP 很高,要么就是强调 mAP 和 FPS 之间 T...

    Amusi
  • 开源软件的商业模式演变分析(三)

    前面两篇谈完了开源软件的发展背景,以及这几年会蓬勃发展的原因,接着来谈究竟开源软件的商业模式如何发展。

    用户5997198
  • 开源软件的商业模式演变分析(一)

    2018年的互联网世界,有两个重大的并购事件,上半年先是Microsoft买下知名开源社群GitHub,下半年蓝色巨人IBM买下开源软件公司Red Hat,被并...

    用户5997198
  • 开源团队管理微信小程序【含服务端和客户端】

    用户5997198
  • 如何用不到200行代码写一款属于自己的js框架

    JavaScript 的核心是支持面向对象的,同时它也提供了强大灵活的 OOP 语言能力。本文将使用面向对象的方式,来教大家用原生js写出一个类似jQuery这...

    徐小夕
  • 基于WebGL的超逼真仿透明液体流动变形效果教程

    这是一款基于WebGL的超逼真液体流动变形效果。该效果使用PixiJS和GSAP来制作,以轮播图的方式来展现不同类型的液体流动变形效果。液体流动变形效果共5组...

    用户5997198
  • 推荐Android几个比较实用的Github开源项目

    作为一个程序猿,最大的开源社区Github肯定是知道的,Android老鸟更加的不用说了,赶项目的时候肯定是去找过合适的开源控件,时间多的时候就...

    Rookie
  • GitHub 上有什么好玩的项目?

    上个月有水友私信问我,GitHub 上有没有比较好玩的项目可以推荐?我跟他说:"有,过两天我整理一下"。

    灵魂画师牧码
  • 开源软件的商业模式演变分析(四)

    前面说过,我认为开源软件公司要能成功,掌握的产品越底层越好,因为越底层,使用者就越多,红帽就是因为占据了最底层的操作系统,这是软件与硬件串接的第一道关卡,任何人...

    用户5997198

扫码关注云+社区

领取腾讯云代金券