专栏首页大数据文摘谷歌AK47制造者:阿米特.辛格博士

谷歌AK47制造者:阿米特.辛格博士

作者:吴军 摘自:《数学之美》

枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord of War)的人也许还记得影片开头的一段话:(在所有轻武器中)最有名的是阿卡47(AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。

我认为,在计算机中一个好的算法,应该向AK47冲锋枪那样简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。Google 的杰出工程师阿米特.辛格博士 (Amit Singhal) 就是为 Google 设计AK47冲锋枪的人,在公司内部,Google的排序算法便是以他的名字命名的。

从加入 Google 的第一天,我就开始了和辛格长期而愉快的合作,而他一直是我的一个良师益友。辛格、Matt Cutts(中国一些用户误认为他是联邦调查局特工,当然他不是)、马丁和我四个人当时一同研究和解决网络搜索中的作弊问题(Spam)。我们需要建一个分类器,我以前一直在学术界工作和学习,比较倾向找一个很漂亮的解决方案。我设计了一个很完美的分类器,大约要花三个月到半年时间来实现和训练,而辛格认为找个简单有效的办法就行了。我们于是尽可能简化问题,一、两个月就把作弊的数量减少了一半。当时我们和公司工程副总裁罗森打了个赌,如果我们能减少 40% 的作弊,他就送我们四个家庭去夏威夷度假,后来罗森真的履约了。这个分类器设计得非常小巧(只用很小的内存),而且非常快速(几台服务器就能处理全球搜索 的分类),至今运行得很好。

后来我和辛格一起又完成了许多项目,包括对中、日、韩文排名算法的改进。每一次,辛格总是坚持找简单有效的解决方案。这种做法在 Google 这个人才济济的公司常常招人反对,因为很多资深的工程师怀疑这些简单方法的有效性。不少人试图用精确而复杂的办法对辛格的设计的各种“AK47” 进行改进,后来发现几乎所有时候,辛格的简单方法都接近最优化的解决方案,而且还快得多。另一条选择简单方案的原因是这样设计的系统很容易查错 (debug)。

当然,辛格之所以总是能找到那些简单有效的方法,不是靠直觉,更不是撞大运,而是靠他丰富的研究经验。辛格早年从师于搜索大师萨尔顿(Salton)教授,毕业后就职于 AT&T 实验室。在那里,他和两个同事半年就搭起了一个中等规模的搜索引擎,这个引擎索引的网页数量虽然无法和商用的引擎相比,但是准确性却非常好。在 AT&T,他对搜索问题的各个细节进行了仔细的研究,他的那些简单而有效的解决方案,常常是深思熟虑去伪存真的结果。

辛格非常鼓励年轻人不怕失败,大胆尝试。一次一位刚毕业不久的工程师因为把带有错误的程序推出到 Google 的服务器上而惶惶不可终日。辛格安慰她讲,你知道,我在 Google 犯的最大一次错误是曾经将所有网页的相关性得分全部变成了零,于是所有搜索的结果全部是随机的了。这位工程师后来为 Google 开发了很多好的产品。

辛格在 AT&T 时确立了他在学术界的地位,但是,他不是一个满足于做实验写论文的人,于是他离开了实验室来到了当时只有百、十人的 Google。在这里,他得以施展才智,重写了 Google 的排名算法,并且一直在负责改进它。辛格因为舍不得放下两个孩子,很少参加各种会议,但是他仍然被学术界公认为是当今最权威的网络搜索专家。2005年, 辛格作为杰出校友被请回母校康乃尔大学计算机系在 40 年系庆上作报告,获得这一殊荣的还有大名鼎鼎的美国工程院院士,计算机独立磁盘冗余阵列(RAID)的发明人凯茨(Randy Katz) 教授。

摘自:数学之美

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-05-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Google是如何做移动搜索的

    大数据文摘
  • D-News周播报 |雅虎五亿用户信息泄漏 Google云宣布提供区块链测试服务

    大数据文摘
  • 面对20亿行代码,Google如何管理?

    大数据文摘
  • “Google,不许联想”

    允中 编译 wired 量子位 出品 | 公众号 QbitAI 美国科技媒体Wired说:Google的自动联想功能,至今Bug多多。 比如当你搜索“伊斯兰主...

    量子位
  • Google CEO 在愚人节这天来华,真的是来下围棋的吗?

    镁客网
  • 号称「程序员春晚」的 Google I/O 曾发布过哪些大杀器?

    每年的 Google I/O 和 MDCC 之类的技术开发者大会往往会被大家称为「程序员春晚」,除了因为在这些大会上经常会发布革命性的技术、产品和未来趋势,还因...

    HyperAI超神经
  • Super快报第8期:今天的消息来自Google和苹果

    来自Google和苹果的报道如下: 一、谷歌董事长访问金日成大学 参观学生上网 Google执行董事长斯密特昨天到朝鲜金日成大学参观学生们上网。该大学学生访...

    罗超频道
  • [新知] Google地图应用机器学习技术,自动清除7,500万笔不良评论

    “ Google地图上的不当内容,在还未被其他用户看到之前,就会被Google地图的自动侦测系统删除”

    阿泽
  • 文件被占用?系统自带的“资源监视器(resmon)”也能帮你找到占用它的真凶

    发布于 2018-03-09 13:26 更新于 2018-05...

    walterlv
  • 外媒:Google被迫终止了搜索引擎业务重返中国的计划,转而搜集分析全球华人的搜索数据

    265网址导航页只是“蜻蜓计划”(又称Dragonfly)的数据组成部分之一,Google此计划的数据分析团队,正在转向研究来自美国、马来西亚等国家的中文搜索请...

    数据猿

扫码关注云+社区

领取腾讯云代金券