【业界】AI发展得有多快? 斯坦福大学给出了一份成绩单

事实证明,我们很难预测AI的新进展何时会发生。在1956年的the Dartmouth Summer Research Project研究项目中,科学家们认为也许两个月的时间就足以在一系列复杂的问题上取得“重大进展”,包括能够理解语言、提高自我、甚至理解抽象概念的计算机。

六十年过去了,这些问题还没有解决。来自斯坦福大学的AI指数(AI Index)是一个试图用来衡量AI方面取得了多大进展的尝试。

该指数采用了一种独特的方法,并尝试在多个系统中聚合数据。它包含了大量的活动指标,包括衡量风险投资、出席学术会议、发表论文等等。结果是你可能期望的:自1996年以来,学术活动增加了10倍,专注于AI的初创公司爆炸式增长,以及相应的风险资本投资。这个度量标准的问题在于它和AI的进度一样,这两者可能是相关的。

该指数还从流行的编码网站Github上获取数据,Github拥有比世界上任何人都多的源代码。他们可以跟踪与AI相关的软件开发人员的数量,以及像Tensorflow和Keras这样的流行机器学习包的兴趣水平。该指数还追踪了有关AI的新闻报道的情绪:令人惊讶的是,考虑到世界末日和就业危机,那些被认为“积极”的人比“消极”的人多3倍。

但同样,这也可能只是对AI热情的一种衡量标准。

没有人会否认,我们正处在一个AI炒作的时代,但AI的发展却充斥着各种炒作,以及与AI交替出现的迅猛增长。因此,AI指数试图跟踪算法在一系列任务上的进展。计算机视觉在大规模视觉识别挑战中表现如何?(有人从2015年以来开始对图像进行注释,但他们仍然不能很好地回答关于图像的问题,将自然语言处理和图像识别结合起来)。在电话上的语音识别几乎是对等的。

在其他狭窄的领域,AI仍在追赶人类。翻译可能已经足够好了,你通常可以理解所讲内容的要点,但在BLEU指标上,翻译的准确性仍然很差。AI指数甚至记录了程序在SAT测试中的表现,所以如果你拿了它,你可以把你的分数和AI的分数进行比较。

衡量最先进的AI系统在狭窄任务上的表现是有用的,而且相当容易做到。你可以定义一个简单的度量,或者设计一个与评分系统的竞争,并以标准化的方式与旧的软件进行比较。学者们总是可以讨论评估翻译或自然语言理解的最佳方法。Loebner奖,一个简化的问答图灵测试,最近采用了Winograd模式类型的问题,它依赖于上下文的理解。AI在这些方面有更多的困难。

然而,评估真正变得困难的地方,是试图将这些狭隘任务的表现映射到一般智力上。这很难,因为我们对自己的智力缺乏了解。电脑在国际象棋上是“超人”,现在甚至有更复杂的游戏。提出时间线的braver预测者认为AlphaGo的成功比预期的要快,但这是否意味着我们更接近于一般的智力呢?

我们可以注意到算法在先前为人类保留的任务上的特殊性能,例如,该指数引用了一篇自然论文,表明AI可以比皮肤科医生更准确地预测皮肤癌。我们甚至可以试着追踪一种特定的方法来对付AI;例如,计算机成功模拟了多少大脑区域?或者,我们可以简单地记录下职业和专业任务的数量,这些任务现在可以通过AI来达到一个可接受的标准。

“我们正在赛跑,但我们不知道如何到达终点,或者我们必须走多远。”

未来几年,AI的进展更有可能类似于逐渐上升的潮汐,因为越来越多的任务可以转化为算法,由软件完成,而不是突然的智能爆炸或一般智力突破的海啸。也许可以通过测量AI系统的能力来学习和适应基于办公室任务的人类的工作程序。

AI指数并没有试图给出一般智力的时间表,因为这仍然是一个模糊的概念。

牛津大学计算机科学系主任Michael Woodridge指出:“报告中没有提到的主要原因是,我和其他人都不知道如何衡量进展。”他担心的是另一个AI的冬天,并夸大了已经取得的进展。

所有专家提出的一个关键问题是AI的伦理学。

当然,你不需要一般的智力来影响社会;算法已经在改变我们的生活和我们周围的世界。为什么亚马逊、谷歌和Facebook都值这么多钱呢?专家们一致认为需要建立一个指数来衡量AI的益处,人类和AI之间的相互作用,以及我们对这些系统的价值、伦理和监督的能力。

哈佛大学的Barbra Grosz认为:“通过他们对人们生活的影响来确定AI系统的成功措施是很重要的。”

对于那些关心AI就业启示的人来说,追踪在被认为最脆弱的领域(比如自动驾驶汽车取代出租车司机)使用AI将是一个好主意。社会适应AI趋势的灵活性也应加以衡量。我们是否为人们提供了足够的接受教育的机会?教他们和算法一起工作,把他们当作工具而不是替代品?专家们还指出,这些数据是以美国为中心。

我们正在进行一场比赛,但我们不知道如何到达终点,也不知道我们要走多远。从周围的风景看,我们已经跑了很远。因此,衡量进展是一项艰巨的任务,从定义进展开始。但AI指数作为每年收集的相关信息,是一个良好的开端。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-01-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

一部人工智能的口述史,人工智能先驱们Hinton, Bengio, Lecun等人的访谈实录

1572
来自专栏机器之心

机器学习应用行业浮躁、产品差?身为工程师的你是否想转行

网友 thetall0ne1 表示,「我在一家技术公司使用、售卖机器学习应用好多年了,有时也会感到厌倦。不过,我倒支持使用深度学习模型解决问题。因为我发现结果很...

652
来自专栏大数据文摘

业界 | Kaggle问卷主成分分析,16000万数据从业者面临这5类挑战

1336
来自专栏大数据文摘

斯坦福首席人工智能科学家:如何教计算机“看懂一张图”?

3369
来自专栏镁客网

硬纪元AI峰会实录 | 英伟达何犹卿:AI深度学习正在改变世界

18410
来自专栏机器之心

人物 | Yann LeCun:让Facebook学会思考的人

选自BuzzFeed 作者:Alex Kantrowitz 机器之心编译 Yann LeCun 是深度学习研究领域内一个响当当的名字。作为 Faceboo...

2589
来自专栏新智元

【2018将成为AGI元年】13名专家盘点2017最重要AI事件,预测AGI将取代AI

来源:kdnuggets.com 作者:Matthew Mayo 编译:刘小芹 常佩琦 闻菲 【新智元导读】2017年人工智能最重要的发展是什么,2018年...

3245
来自专栏云加新鲜事儿

腾讯 AI Lab 张潼主任带你轻松 get AI 新知识

读完本文后,你将了解什么是AI?有哪些研究方向和应用场景?AI对你有什么影响?为什么现在又爆发AI热潮?AI的未来又是怎样的?

7.2K3
来自专栏新智元

【巨头升级寡头】AI产业数据称王,GAN和迁移学习能否突围BAT垄断?

【新智元导读】AI时代,数据为王让巨头越来越难以被打败。谷歌和 CMU 的10亿+数据集的设想,似乎又将这一假设往前推进了一步。数据为王还是算法为王,这是人工智...

4056
来自专栏人工智能头条

语音识别真的比肩人类了?听听阿里 iDST 初敏怎么说

1132

扫码关注云+社区