如果你用过互联网,那你对判断你是否是人类的验证码肯定很熟悉,其形式包括注册时输入验证码,买火车票时选择图片等。这类验证码一般是让用户输入一个扭曲变形的图片上所显示的文字或数字,扭曲变形是为了避免被光学字符识别(OCR, Optical Character Recognition)之类的计算机程序自动识别出图片上的文字或数字而失去测试效果。
这类验证码有个专业的名字,那就是全自动区分计算机和人类的公开图灵测试(英语:Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA)。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。
这种普遍应用的技术不是啥问题,问题是各种身份验证码现在越来越难以识别,这当然不是因为你不是人类而是因为人工智能越来越聪明导致的。
近年来,机器学习在基础性的文本、图像和语音识别任务上的表现与人类已经不相上下,甚至有过之无不及,以至于为了保持CAPTCHA区分人类和机器的能力,CAPTCHA现在对人类越来越难。
以前,CAPTCHA可以通过让人识别扭曲的文字来轻易过滤算法。但到2014年,机器在解决这类问题时已经超过人类。此后很多网站转而使用该图片识别,例如12306就经常让用户找出图片中的中国结或交通信号灯。然而,人工智能现在在这类问题的解答能力上也超过人类。
为了解决这个问题,新的 CAPTCHA 混入了文化元素和游戏元素,这确实让计算机难以理解,但人类也难以解决这个问题了。人类是具有智能的,但人类之间在语言、文化习俗和经验上也存在巨大差异。过多的文化元素和游戏元素,让人类也越来越难以证明自己是人类了。
到底什么是人类呢?这越来越成为一个问题了。
领取专属 10元无门槛券
私享最新 技术干货