阻碍你抢票的“罪魁祸首”竟然是他?

我们在使用互联网的过程中,可以看到网站往往会通过验证码来辨别用户是否是机器人,验证码实际上就是人类和计算机的一场战争。但有时候你会发现,验证码也是让人感到十分无奈,有的时候严重扭曲到不能通过人眼来识别。

随着电脑信息技术的飞速发展,有效图像识别技术已经被开发出来,但目前大部分网站使用的文本验证码还是有用的。尖端的图像识别技术需要花费大量时间金钱成本,黑客们是不会用它们来破解你的博客、窥探你中午打算吃什么的。只有那些涉及机密、金钱利益的网站,比如网上银行、购物网站等受到了较大的威胁。为了防止财产损失,这些网站纷纷推出了各种进化版的验证码。主流的验证码都是静态图片,有些网站推出了动态的验证码,令机器人很难捕捉,同时动画效果能够增加网页的美观程度。很多大型的购物网站要求发送手机短信验证码,确保操作用户是本人。又或者是问用户一个常识性的问题,比如“牛奶和汽油哪个可以喝?”——总之就是一些机器不会、但是人类可以轻易做到的事。

12306购票网站曾经因为更换了一种“超难”的图形验证码而在各媒体报纸上大出风头。大家都知道,节日期间的火车票很难买,而众多抢票软件更是火上浇油,令网络购票变得更加艰难、混乱。为了拦截住那些违反公平的抢票软件,12306网站推出了这种让人大呼“坑爹”的验证码系统:系统要求想买票的用户在一堆图片里找出目标物体,比如便利贴、汉堡、玉米等常见事物,虽然很多人在不习惯的情况下觉得有点难,但这对于想钻空子的机器程序来说,更是难如上青天。

验证码也很年轻

一开始,网络上是没有验证码的。那时想要在论坛上发帖,只需轻轻敲一下回车键。然而,那个时代却没有大家以为的那么平静,当时的黑客也十分猖狂:他们编写了一种能够大量、重复编写信息的程序,伪装成人类用户,肆无忌惮地在网络上倾倒大量的、无意义的“僵尸”信息,垃圾邮件、垃圾广告、垃圾评论。论坛被灌水,有用的信息很快会被淹没,很多网站的正常运营遭到破坏。除此之外,还有数之不尽的程序机器人使用不断尝试的方法恶意破解密码、恶意刷票,从中获取非法的利益。强而有力的程序机器人如同霸王龙一样横行霸道,网络世界一片狼藉,眼看着就要失控了。

其中,受影响最大的当属电子邮件的提供商:他们的用户每天收到数以百计的垃圾邮件轰炸,严重地影响了正常的工作;更要命的是,这些垃圾邮件还是用他们的免费邮箱发出的。他们不可能一一审查邮件,因为那既不尊重隐私,工作量也太大。难道就没有任何手段约束程序机器人了吗?当时最有实力的邮件提供商Yahoo(雅虎)公司决定下狠劲改善这个问题。很快,雅虎的负责人联系到了当时卡内基梅陇大学一位21岁的学生,他叫路易斯·冯·安(Luis von Ahn)。

路易斯是一个计算机天才,17岁进入卡内基梅陇大学,在大学时期,他凭借良好的表现获得了导师曼纽尔·布鲁姆(Manuel Blum)的赏识,他的傲人履历也很可能是雅虎向他伸出橄榄枝的原因。

在研究过程序机器人的“工作手法”之后,他给出了一个独特的方案:在用户进行操作之前,就将那些机器人从正常用户里揪出来。大家都知道图灵测试的目的是将机器伪造成人类,而路易斯的方案就是“反”过来:通过简单的方法将试图伪装成人类的程序机器人鉴定出来。

路易斯发现,人类可以用肉眼很轻易地识别图片里的文字信息,而机器就不能。当时的计算机辨识技术还很落后,对于那些镶嵌在图片中的、被扭曲过、污染过的文字无法辨识,而人类只需要稍稍皱眉就可以识别出来。路易斯在导师布鲁姆的帮助下很快设计了一个程序,它先是产生一个随机的字符串,比如smwm,然后对这串字符进行随机的扭曲、重叠、污染,再显示给要进行操作的用户。只要能够识别这个变形了的smwm的,就是人类。

这个设计方案后来被命名为“CAPTCHA”,这是“Completely Automated Public Turing test to tell Computers and Humans Apart”首字母的缩写,意思是“全自动区分计算机和人类的图灵测试”,虽然看上去很夸张,但实际上还是挺简单易懂的。它的中文译名就是大家熟知的“验证码”啦。

本文来自企鹅号 - 易采办媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

4.11 VR扫描:谷歌Pixel 3曝光或将搭载骁龙846;亚马逊或将AR技术用于汽车零件销售

25250
来自专栏科技向令说

信息安全问题频发的社交里,谁来保护我们的隐私?

近日Snap上市,市值一度超过400亿美元,成为继阿里巴巴上市以来全球最大IPO。资本和公众觊觎的无非是Snap背后社交的巨大想象空间。

7930
来自专栏JetpropelledSnake

HCNP学习笔记之HCNP学习的几种境界

14940
来自专栏PPV课数据科学社区

面向程序员的数据挖掘指南(一)

? 作者:Ron Zacharski 第一章:简介 内容: 寻找事物 本书结构 阅读完本书后你可以做些什么? 为什么数据挖掘很重要?哪些内容可以为我所用? ...

35470
来自专栏工科狗和生物喵

计算机(处理器)发展史 (PS:课程论文)

正文之前 写死写活的一篇课程论文,让我去探讨了下计算机的发展历史。很有趣,写了我好几天呢!! 正文 【摘要】 计算机的发展史,很大一部分是计算机处理器的发展史。...

41890
来自专栏非著名程序员

程序员的技术修炼如登峰,到不了顶也要努力向上攀!

为了学习React Native,我用了5天时间研究了JavaScript,并写了四篇文章总结自己的认识,有人留言:“才学了5天就能这么厉害?”。前段时间,我花...

23480
来自专栏企鹅号快讯

机器人产业链分析-机器人基本知识

机器人是一个广义的词语,机器人(Robot)是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动...

18950
来自专栏姬小光

初创公司如何在 BAT 的夹缝中寻找机会

创业的思路有很多种,若你不乏奇思妙想,点子源源不断,那么本文可能并不适合你。本文想讨论的,是围绕大公司的产品生态,或各个产品之间的夹缝地带催生的一些机会。长期关...

9220
来自专栏AI科技大本营的专栏

AI 行业实践精选:Chatbot 的拐点之年

目前,Facebook 的 Messenger 以及 Kik 等聊天机器人软件都在努力做出改变,争取不辜负当初的宣传噱头,在一定程度上促进了聊天机器人的成功。 ...

42360
来自专栏大数据文摘

南埃文代尔小学的实践:增大数据获取难度竟然提高了数据利用率

11510

扫码关注云+社区

领取腾讯云代金券