【人在环中】机器学习的未来

现在机器学习已经变得越来越主流,一些设计模式渐渐浮现。作为CrowdFlowe的CEO,我与许多构建机器学习算法的公司合作过。我发现了在几乎任何一个成功将机器学习应用于复杂商业问题的案例中,都有“人在环中”的运算。它是这样的:

首先,一个机器学习模型先对数据,或者每一个需要标记的视频、图片和文件,做处理。这个模型也给出了一个置信分数(confidencescore),表示这个算法有多大可能做出了正确的判断。

如果置信分数低于了某个值,它会把数据发送给人类,让人类做判断。人类做出的这个新判断既会被应用于处理过程中,也会被输入算法中、让算法更智能。也就是说,当机器不确定答案的时候,它求助于人类,然后将人类给出的判断加入自己的模型中。

这个简单的模式是许多出名的应用于实际案例的机器学习算法的核心。它解决了机器学习最大的问题,即:让一个算法达到80%的准确率非常简单,但要让它达到99%却几乎是不可能实现的。这种机器学习模式让人类来处理那20%的内容,因为仅仅80%的准确率对大部分实际应用来说是不够的。

自动驾驶汽车

自动驾驶汽车是解释“人在环中”运算的一个很好的例子。聪明的人们已经花了许多许多年来研制自动驾驶汽车,这方面最新的科技也的确非常好了。但非常好仍然不够好。99%的准确率意味着人们在1%的时间里可能会死去。

特斯拉最近启动了一个根据人在环中模式制作的自动驾驶模式。特斯拉汽车大部分时候在高速公路上自动行驶,但它坚持要求人类驾驶员手握方向盘。当视觉的机器学习系统感知到对情况有困惑——可能前方有施工,雪,或者什么不寻常的东西——它把控制权转交回人类司机手中。所以虽然特斯拉汽车的确可以在几乎大部分时候都自动驾驶,它也需要人类为它防止可能的故障。想想要是没有这一点约束的话可能有什么后果吧,然后你就明白它存在的原因了。

在Facebook的照片上标记朋友

Facebook的照片识别算法已经特别棒了。事实上,当你上传了照片,它通常不仅能找到照片上的人脸,还能够以97.25%的准确率猜出这个人是谁。

但有些时候,当它的置信分数低于一定水平,Facebook会询问作为上传者的你,确认照片中标记的人有没有错。当置信分数更低的时候,它会让你来标记照片中的人。所有这些人类给出的信息都会返回到算法中,让算法变得更好。

ATM

曾经,当你用ATM机存支票的时候,你需要告诉它支票上有多少钱。但随着光学字符识别(OCR)技术的巨大进展,通常来说,你的ATM机会使用视觉算法,不仅了解到支票数额,还能知道其他相关信息,例如汇款路线号码(routingnumber)。

这些视觉算法解决了很多问题,不过仍然有一些时候手写字符太过奇怪或者不是常用语言。在这些情况中,你的ATM机会让你输入数额,而这张支票会被传送给人类来识别(这就是为什么一些支票会比其他支票处理时间更长)。就像Facebook的例子那样,你输入的数额给了视觉算法更多数据来学习。

高级国际象棋

许多年前“深蓝”击败了Kasparov,这是AI的巨大胜利。从那时起,国际象棋计算机选手无疑就变得来越多。虽然国际象棋被“彻底解决”仍然是一件相对遥远的事(至少有1043种棋盘位置需要纳入考虑),但计算机选手常常能够击败国际象棋大师,即使大师们被计算机选手让了很多子也无济于事。

但仍有一部分人还在玩一种他们称为“高级国际象棋”的游戏。高级国际象棋中,人类选手与计算机一起行动,找出最佳的落子位置。计算机擅长应对复杂的战术情景,但在长期战略方面比不上人类。最佳的高级国际象棋对局是,计算机选手被用来降低(或者消除)失误,而人类选手则会用他们的直觉来迫使对手进入对方的计算机选手没有怎么见过的战局状态。

这意味着什么?

这意味着人类-计算机的交互对于人工智能来说比我们想象的要重要得多。在每个例子中(国际象棋,驾驶,Facebook,还有ATM机),确保计算机和人类顺利地一起工作是让这些应用发挥效果的关键。然而,重要的是,虽然和人类沟通与和计算机沟通的交互界面是不同的,但是是人类与机器的协作——而不是有一方完全凌驾于另一方——才能带来最佳的结果。

人工智能已经来临,它正在改变事物运作的方方面面。但它并不是在取代人类们的工作和职业。它是在通过处理简单的任务、观察困难的任务并从中学习,来让每个行业、每个职业的人类们都能有更高的工作效率。这也就是说:我们并不会在某天一觉醒来突然发现汽车会自动驾驶了——我们会慢慢让它一点一点地学习掌握。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-11-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?

机器之心专栏 作者:李玉喜 AlphaGo 与世界第一的人类棋手柯洁的对弈比赛已经引起了全世界的广泛关注。不出意外,尽管柯洁表现出色,但 AlphaGo 仍然...

3626
来自专栏大数据文摘

大数据分析的光荣与陷阱——从谷歌流感趋势谈起

17711
来自专栏新智元

双刃剑 | 机器学习的潜力与陷阱

最近这段时间,机器学习吸引了媒体和从业者大量的关注。的确,机器学习是一种变革性的技术。但是,尽管众人对这个话题喋喋不休,尽管风投为机器学习提供了许多资金,尽管谷...

2564
来自专栏FreeBuf

谷歌开源人工智能系统TensorFlow

谷歌于周一发布全新人工智能系统TensorFlow。该系统可被用于语音识别或照片识别等多项机器深度学习领域。谷歌表示,TensorFlow将完全开源,可被运行于...

1859
来自专栏钱塘大数据

2018全球大学AI排名发布,中国高校表现强势

? 近日,麻省理工学院马萨诸塞校区计算机与信息科学学院教授 Emery Berger 发布一个全球院校计算机科学领域实力排名的开源项目 CSranking 更...

4397
来自专栏机器之心

演讲 | 周志华:关于人工智能的探讨

3164
来自专栏PaddlePaddle

技术|深度学习行业应用及就业方向大猜想

一直以来,大家都在盛传深度学习是工程师的风口,但是对于深度学习和行业的联系却很少被提及。

971
来自专栏腾讯研究院的专栏

大数据分析的光荣与陷阱——从谷歌流感趋势谈起

沈艳   北京大学国家发展研究院教授   “谷歌流感趋势”(Google Flu Trends,GFT)未卜先知的故事,常被看做大数据分析优势的明证。200...

2096
来自专栏数据科学与人工智能

【数据科学】数学的意义(院士最全最牛的解释,果断收藏)

作者:张恭庆 (北京大学数学科学学院教授、中国科学院院士、第三世界科学院院士) 数学既是一种文化、一种“思想的体操”,更是现代理性文化的核心。 马克思说:“一...

3218
来自专栏大数据文摘

什么时候应该听取机器决定?

1335

扫描关注云+社区