谷歌收购的这家公司值多少钱?

大数据文摘编辑 如需转载,请后台留言申请

垃圾邮件危机

20世纪90年代后期,网络逐渐变得拥堵起来。有人开发了一款名为“Spambots”的垃圾邮件程序软件,向成千上万名用户批量发送广告信息,淹没收件人的电子邮箱。他们会在各种网站上注册,然后在评论部分留下成百上千条广告。网络因此成了一个不守规矩、不受欢迎、不够友善的地方。而且,这种软件似乎打破了网络原有的开放性和易用性模式,要知道,正是这种模式向人们提供了各种便利,比如免费电子邮件。当票务公司根据“先到先服务”的原则提供演唱会门票网上订票服务时,作弊软件会偷偷摸摸跑到真正排队的人之前,将门票全部买下。

路易斯·冯·安的“验证码”解决方案

2000年,22岁大学刚毕业的路易斯·冯·安(Luis Von Ahn)提出了解决这个问题的想法:要求注册人提供真实身份证明。他试图找出一些人类容易辨别但对机器来说却很难的东西,最后他想到了一个办法,即在注册过程中显示一些波浪状、辨识度低的字母。人能够在几秒钟内识别并输入正确的文本信息,但电脑却可能会被难倒。

雅虎采用了这个方法以后,一夜之间就减轻了垃圾邮件带来的苦恼。冯·安将他的这一创作称为验证码(全称为“全自动区分计算机和人类的图灵测试”)。

五年后,每天约有2亿的验证码被用户输入。

这一切给冯·安这位家里经营糖果厂的危地马拉人带来了相当高的知名度,使他能够在取得博士学位后进入卡内基梅隆大学工作,教授计算机科学;也使他在27岁时获得了50万美元的麦克阿瑟基金会“天才奖”。

但是,当他意识到每天有这么多人要浪费10秒钟的时间输入这堆恼人的字母,而随后大量的信息被随意地丢弃时,他并没有感到自己很聪明。

改进——ReCaptcha

于是,他开始寻找能使人的计算能力得到更有效利用的方法。他想到了一个继任者,恰如其分地将其命名为ReCaptcha。和原有随机字母输入不同,人们需要从计算机光学字符识别程序无法识别的文本扫描项目中读出两个单词并输入。其中一个单词其他用户也识别过,从而可以从该用户的输入中判断注册者是人;另一个单词则是有待辨识和解疑的新词。为了保证准确度,系统会将同一个模糊单词发给五个不同的人,直到他们都输入正确后才确定这个单词是对的。

ReCaptcha值多少钱?

在这里,数据的主要用途是证明用户是人,但它也有第二个目的:破译数字化文本中不清的单词。与雇用人所需要花费的成本相比较,它释放出的价值是非常巨大的。

假设每天完成的ReCaptcha超过2亿次,平均每次输入要5秒,2012年美国的最低工资是每小时7.25美元,如果没有这套系统,每天开销:

7.25*(5*200,000,000/3600) = 201万美元

或者说每年需要花费 7.35亿多美元。冯·安设计的这个系统做到了这一点,并且,没有花一分钱!

谷歌收购

ReCaptcha的作用得到了认可,2009年谷歌收购了冯·安的公司,并将这一技术用于图书扫描项目,在过去几年中,谷歌还开始使用reCAPTCHA 转录谷歌街景中的门牌号码。很可惜,我们在网上并没有查到具体的收购金额。

资料来源:http://zh.wikipedia.org/wiki/Google公司收購列表#cite_note-56

补充,其他形式的验证码

  • 图片验证码,电脑很难识别出图像内容
  • 问题验证码,用图片显示那你识别的数学题目,电脑难以计算答案
  • 3D 验证码,电脑难以识别出 3D 立体的图案
  • 广告验证码,例如给出可乐的标识,让你回答对应的品牌
  • Gif 验证码,多个图层的叠加在一起,电脑难以识别答案在哪个图层
  • 视频验证码,给出一段视频,要求识别出视频内播放出的字符

来源:根据《大数据时代》及网络资料编辑而成。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2015-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【数据科学】怎样进行大数据的入门级学习?

数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解...

296100
来自专栏机器之心

2018 IEEE顶级编程语言交互排行榜发布:Python屠榜

榜单地址:https://spectrum.ieee.org/static/interactive-the-top-programming-languages-...

11910
来自专栏MixLab科技+设计实验室

产品经理最小技能指南之化繁为简的一页纸思考法

在这个快节奏的时代,每天新概念、新名词、新思想应接不暇。每个人或多或少都存在焦虑感,年轻人焦虑未来、父母焦虑小孩、小孩焦虑考试。这人群中,创业者和企业家人群尤为...

17730
来自专栏黄成甲

怎样成为解决问题的高手——掌握系统循环图(连载六)

在连载三讲了系统思维就是选择、改善或构建“框架”,以更快速、更全面、更深入地系统思考和表达的思维方式。使用框架实现更快速、更全面、更深入解决问题的关键在于框架的...

1.1K10
来自专栏PPV课数据科学社区

【干货】怎样进行大数据的入门级学习?

数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解...

26730
来自专栏大数据钻研

不懂技术的人不要对懂技术的人说这很容易实现

“这个网站相当简单,所有你需要做的就是完成X,Y,Z。你看起来应该是技术很好,所以,我相信,你不需要花费太多时间就能把它搭建起来。” 我时不时的就会收到这样的...

30280
来自专栏WeaponZhi

自我救赎的面试经历——小米篇

为什么我将文章定义为一次自我救赎的面试经历,实际上和我在16年底的一次小米面试经历有关。

7.3K10
来自专栏CDA数据分析师

怎样进行大数据的入门级学习?

文 | 郭小贤 数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。 但从狭义上来看,...

22290
来自专栏张善友的专栏

十年学会程序设计

这里分享一篇 Peter Norvig的 《十年学会程序设计》 (Peter Norvig  系Google研究院主任、美国计算机协会(ACM)资深会员(Fel...

25750
来自专栏镁客网

科学家通过控制Drp1相关蛋白质,实现延年益寿功效 | 黑科技

11200

扫码关注云+社区

领取腾讯云代金券