你的每次认真填写,都是在调教AI

温馨提示:本文约1000字,阅读需时5分钟,内容分为四部分:1、我们会遇到怎样的验证码?2、验证码的目的是什么?3、验证码有何原理?4、经调教后的AI成效如何?5、验证码的现状。

1、我们会遇到怎样的验证码?

常在江湖走,哪有不湿鞋。常在网上混,谁没填过几次验证码?

我们通常遇到的验证码,有的要求对图片进行分类,有的让你从中勾选出某图,有的需要答题算数。虽然我们不明白为什么要验证,但一般都会照做。

2、验证码的目的是什么?

其实,这些验证码背后对应的计算逻辑,就是在利用我们的填写,给AI调教充当义工。

目前应用最广的验证码系统就是 reCAPTCHA。(这个英文全称太长了,你不必记下来)

这套系统承担了世界上大部分网络的人机验证工作。

该系统设计的初衷就是为了解决文本数字化的问题,即:将浩瀚如海的纸质书籍转录成电子档。

人工录入,效率低下,且出错率高。文本扫描又面临着效果太差,格式错乱或不兼容等问题。于是路易斯(Luis von Ahn)于2007年发明了该套系统,他说:“如果人类与机器各有擅长,能不能利用验证码系统,让人类和机器共同解决问题呢?”

3、验证码有何原理?

在reCAPTCHA 的验证码系统里,一个验证码会由两部分构成:一部分是既有的,另一部分则是需要填写的。

背后对应的逻辑是:首个用户填写一部分后,reCAPTCHA会自动匹配上另一部分,并将整个结果录入并反馈至项目主机;主机会把该结果再次派发给其他多个不同用户进行交叉验证,以确保没有不小心或故意输错的情况。

太专业了是吧?翻译成人话就是:真正有效的人机测试在验证码的第一个步骤已经完成,而后面的过程,就是用户在义务调教AI。

4、经调教后的AI成效如何?

粗略统计,到今天为止, reCAPTCHA已经录入了从 1851 年至今的所有《纽约时报》,共计 1300 万篇文章。除《纽约时报》外,reCAPTCHA 还数字化了超过 2500 万本书,而全球的图书数量约为 1.3 亿本。

路易斯在接受媒体 The Hustle 采访时,这样评价 reCAPTCHA :“我创造了一个系统,以十秒为单位,数百万小时为增量,来利用世界上最宝贵的资源:人的大脑。”

5、验证码的现状。

2009 年,Google 以2780 万美元的价格收购了reCAPTCHA,并开始利用该帮助标注数据。到此,验证码开始焕发了它“事业的第二春”——标注和筛选数据库。

也就是说,验证码在和中国大公司里的各种鉴定师们抢饭碗了。而我们,每一个网民,都是reCAPTCHA “背后的人”,而且是免费和义务地帮它调教AI、帮它抢鉴定师的金饭碗。

该文改编自企鹅号:pingwest中文网。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181219A11MPD00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券