业界 | AI技术不是趋同,而是正在放大差距

作者:吴欣

「暴火」了两年多之后,在中国人工智能领域,渐渐有了更多理性思考的发声。在 5 月 19 日召开的 2018 年中国图灵大会上,依图科技 CEO 朱珑博士就讲到:AI 发展太快,全球研究的积累不够的背景下,各种 AI 观点甚嚣尘上,技术上难辨真假、好坏,AI 跳跃性的发展也使得 AI 进入到没有技术权威的时代,并且这是整个时代呈现出的特点。

依图是诞生于 2012 年的一家人工智能创业公司,CEO 朱珑创办依图前,在美国做过十多年 AI 相关的研究,15 年前他还在微软亚洲研究院做过研究。在美国期间,朱珑先是在 UCLA 读统计建模和统计学计算方向的博士,当时他的导师叫艾伦·尤尔,艾伦的博士导师就是著名的理论物理学家霍金。后来,朱珑进入麻省理工学院的 AI Lab,做计算机视觉建模相关的博士后研究员;回国创业前,朱珑在深度学习爆发之前 Yann Lecun 的实验室做研究。

既有强大的学术界的背景,又在工业界创业期间历经中国 2012 到 2018 年,朱珑深感于中国发生的巨大变化——在过去中国没有成熟的科技创业的情景和市场机制,而这几年开始,中国各种背景的人在一起交流的越来越多,并且这已经是新的形态。他解释说,过去,政府、投资者、媒体这三者是比较频繁交流的,但是在 2012 年之前,学术界不像今天这样经常会被政府邀请来交流,也不会被一流的投资基金邀请交流。

那么人工智能技术的发展是否也进入了新的形态?最近甚至有一些讨论:技术是不是发展到了瓶颈?各项算法之间有没有区别?

AI 技术不是趋同,而是正在放大差距

随着 AI 热潮的涌现,各家 AI 公司都会频繁参加一些比赛以证明自己的算法实力,以人脸识别算法为例,各家 AI 公司在 LFW 等类似的计算机视觉比赛中都取得 99.xx% 的成绩。于是人们会问:AI 算法是否已经趋同了?如果算法精度差别不大(只有几个百分点),是否意味着创业公司的技术已经同质化了,没有技术创业的核心竞争力了呢?

实际上,这是典型的认知误区。我们在朱珑的演讲中看到了一张表,可能更准确的回答了这个问题,这是中国某省 1 亿人像库,在真实刑侦案件的破案环境下性能测试的对比表,参与方是知名的几大人脸识别公司:

我们可以这样理解这张图:必须对应场景来谈算法精度。不同场景的算法精度不具备任何可比性,甚至不代表有相关性。换句话说,简单场景下算法精度高,不代表在复杂的高难度场景下有更大的概率可以把算法精度做高。好比在小学考试中拿满分,未必能在大学考试中也拿满分。

如今,很多学术界比赛使用的都是公开数据集,数据集内多是互联网照片,相当于是一场难度不大的开卷考试,「考生」很容易就可以把测试成绩刷到比较高,这就出现了上面提到的,各家 AI 公司类似 LFW 之类的计算机视觉比赛中都能取得 99.xx% 的成绩。

然而,在实际应用中,技术遇到的会是各种无法预见的高难度场景,包括变形、昏暗、逆光、强光、光照不均、低清、运动模糊、遮挡、跨年龄段比对、面部变形等等,在这种情况下,各家的差距被迅速拉开,第二名和第一名的错误率能相差几倍以上,远未到趋同的程度。

进入实战后,技术的差距体现在具体产品或应用上,不是简单的好用和一般好用的差距,而是可用和不可用的差距,而实战中是要以最高效率解决实际问题为目的。假如在一个 1 亿级别的人像系统中进行 1:N 的静态比对,错误率相差几倍,就导致使用者的做事效率下降几倍。即便使用者是在一个多算法平台上,久而久之,他也只会倾向于使用第一名的算法。

可见,人工智能技术不是趋同,相反,是正在放大差距!

AI 提供了一把「尺子」,帮助探索人类智慧边界

依图科技曾经做过一个实验,在千万量级的身份数据库上,一个人将女朋友的生活照输入进去,在 AI 输出相似度前十的照片中,这个人完全无法辨别哪张照片上面的脸属于他的女朋友。这意味着,AI 从过去识别生人的能力比人强,到今天,识别熟人的能力也已经超越人类了。

这就引发了另外一个问题:我们人类自身的识别能力的规模和精度,到底是什么程度的?朱珑在现场展示了下面这张相似度分布图:

右上角是输入的人像图片跟自己身份证件照的比对,相似度分数是 98 分;跟自己十年前的照片相比是 97 分;跟自己的圣诞节彩妆照(采光清晰)比对得到了 88 分;跟自己儿童时代的照片比是 76 分;在重度化妆之后,就跌到了 40 分。

最右下角是一对同卵双胞胎,在机器眼中,它们的相似度达到 98 分;往左一组,是一个机构里最像的两个人(非双胞胎),它们的分数能达到 90 分;再往左一组,相差几岁的姐妹相似度为 64 分;而网友觉得很像的姚明和李宇春,机器打了 60 分。据说,2013 年第 57 届韩国小姐,前 18 名佳丽的两两间平均相似度是 63 分,很接近姐妹;18 位中最像的一对达到惊人的 90 分!

在过去,人类无法做任何科学实验来获取结果,然而今天有了人工智能,机器可以提供一个非常稳定的表现,当识别数据规模非常大的时候,也能够很轻易地识别 1 亿人、10 亿人。这样一来,机器识别相当于提供了一把尺子,根据相似度比例筛选出来给人去测,可以在有效的时间里面,测出一个人自己「看」这个世界的能力。而这也是人类第一次有一个非常稳定的机器,具备识别能力,可以看到人和机器智能的差别程度。

依图还做了另外一个颇为有趣的实验:在 13 亿中国人中有多少人跟你长的一模一样?「一模一样」的定义是连自己的妈妈也辨别不出来。

实验的结果是,每 1 亿人当中就有一个人跟自己长的一样,这「一亿分之一」的区分度意味着什么呢?每 1 亿人当中就有一个人跟你长的像,又意味着什么?或许可以从人类基因进化的角度做一些解读。

在人类进化过程中,视觉识别能力在各大感官中的比重越来越大,也许是因为人类开始进行穿着,人嗅觉识别家庭成员的能力与其他哺乳动物相比,算是比较低下,甚至人类主要就是通过看人脸来辨别同类。选择压力驱使人类的脸之间的区分度需要尽量的大,这样才能保证家庭成员的稳定性得到保障。

作为社群动物,人需要和大量同类打交道,而脸部识别错误的代价将是失去整个基因组的遗传继承。就好比,人类出门回家后,认不出自己的孩子、父母、老婆,一定会引发社会动荡,影响到人类的基因进化。

实际上,对应的编码人脸形状的基因数量需要很大,目前知道有一条染色体的一大块用于编码脸部特征。而一亿分之一的识别度将是一个具有巨大社会学意义的统计数值,背后还会有更多的生物学意义也值得更近一步的探讨。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

对大脑的逆向工程是不是走向强AI的唯一出路?

1538
来自专栏机器之心

「凡是过往,皆为序章。」64岁的RODNEY BROOKS谈人工智能的起源与发展

1195
来自专栏AI科技评论

Facebook、微软、谷歌三大研究巨头齐聚首,共同探讨人工智能发展现状和趋势

AI 科技评论消息,日前 AAAS 在 reddit 上组织了一场问答,Facebook 人工智能研究院 Yann LeCun,微软研究院院长 Eric Hor...

3275
来自专栏AI研习社

数据科学工作者(Data Scientist) 的日常工作内容包括什么?

众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容。即使在2017年,数据科学家这...

3053
来自专栏AI科技评论

CVPR 2016:这些黑科技在悄悄爆红

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,谷歌,DeepMind,Uber,微软等巨头的人...

35612
来自专栏新智元

【Science AI特辑】变革了人类社会的基础科学,正在遭遇AI革命

【新智元导读】 7月7日,Science发布最新一期杂志,本期为 AI 特辑。人工智能本身是一门科学,现在,它也在变革科学。《Science》以AI在科学研究...

3103
来自专栏大数据挖掘DT机器学习

为何机器学习的黄金时代才刚刚来临

虽然已被关于神经网络、人工智能和机器学习的热烈讨论所包围,但很多人都知道,这些方法根本没有什么新颖的东西。让人疑惑的是,这些算法和方法早在几十年前就已经存在了...

3236
来自专栏CDA数据分析师

大数据并非万能:3个方面无能为力!

人们对大数据寄予了许多的希望:卖出更多的货物,做出更好的产品,找到更酷的朋友,甚至帮我们决定明天早上是否睡个懒觉。现在,凡是有信息流通的地方,都有人们对大...

1648
来自专栏华章科技

AI取代人类?这4种工作仍将是从业者的“铁饭碗” | 未来

导读:围棋人机大战、人脸识别、自动驾驶、智能控制、语言和图像理解……这些年,人工智能的威力,我们已经见识过太多。“人工智能”甚至入选“2017年度中国媒体十大流...

814
来自专栏计算机视觉战队

神经网络机制中的脑科学原理

什么是类脑计算? 一般地说,类脑计算是指借鉴大脑中进行信息处理的基本规律,在硬件实现与软件算法等多个层面,对于现有的计算体系与系统做出本质的变革,从而实现在计算...

3247

扫码关注云+社区