【人在环中】机器学习的未来

现在机器学习已经变得越来越主流,一些设计模式渐渐浮现。作为CrowdFlowe的CEO,我与许多构建机器学习算法的公司合作过。我发现了在几乎任何一个成功将机器学习应用于复杂商业问题的案例中,都有“人在环中”的运算。它是这样的:

首先,一个机器学习模型先对数据,或者每一个需要标记的视频、图片和文件,做处理。这个模型也给出了一个置信分数(confidencescore),表示这个算法有多大可能做出了正确的判断。

如果置信分数低于了某个值,它会把数据发送给人类,让人类做判断。人类做出的这个新判断既会被应用于处理过程中,也会被输入算法中、让算法更智能。也就是说,当机器不确定答案的时候,它求助于人类,然后将人类给出的判断加入自己的模型中。

这个简单的模式是许多出名的应用于实际案例的机器学习算法的核心。它解决了机器学习最大的问题,即:让一个算法达到80%的准确率非常简单,但要让它达到99%却几乎是不可能实现的。这种机器学习模式让人类来处理那20%的内容,因为仅仅80%的准确率对大部分实际应用来说是不够的。

自动驾驶汽车

自动驾驶汽车是解释“人在环中”运算的一个很好的例子。聪明的人们已经花了许多许多年来研制自动驾驶汽车,这方面最新的科技也的确非常好了。但非常好仍然不够好。99%的准确率意味着人们在1%的时间里可能会死去。

特斯拉最近启动了一个根据人在环中模式制作的自动驾驶模式。特斯拉汽车大部分时候在高速公路上自动行驶,但它坚持要求人类驾驶员手握方向盘。当视觉的机器学习系统感知到对情况有困惑——可能前方有施工,雪,或者什么不寻常的东西——它把控制权转交回人类司机手中。所以虽然特斯拉汽车的确可以在几乎大部分时候都自动驾驶,它也需要人类为它防止可能的故障。想想要是没有这一点约束的话可能有什么后果吧,然后你就明白它存在的原因了。

在Facebook的照片上标记朋友

Facebook的照片识别算法已经特别棒了。事实上,当你上传了照片,它通常不仅能找到照片上的人脸,还能够以97.25%的准确率猜出这个人是谁。

但有些时候,当它的置信分数低于一定水平,Facebook会询问作为上传者的你,确认照片中标记的人有没有错。当置信分数更低的时候,它会让你来标记照片中的人。所有这些人类给出的信息都会返回到算法中,让算法变得更好。

ATM

曾经,当你用ATM机存支票的时候,你需要告诉它支票上有多少钱。但随着光学字符识别(OCR)技术的巨大进展,通常来说,你的ATM机会使用视觉算法,不仅了解到支票数额,还能知道其他相关信息,例如汇款路线号码(routingnumber)。

这些视觉算法解决了很多问题,不过仍然有一些时候手写字符太过奇怪或者不是常用语言。在这些情况中,你的ATM机会让你输入数额,而这张支票会被传送给人类来识别(这就是为什么一些支票会比其他支票处理时间更长)。就像Facebook的例子那样,你输入的数额给了视觉算法更多数据来学习。

高级国际象棋

许多年前“深蓝”击败了Kasparov,这是AI的巨大胜利。从那时起,国际象棋计算机选手无疑就变得来越多。虽然国际象棋被“彻底解决”仍然是一件相对遥远的事(至少有1043种棋盘位置需要纳入考虑),但计算机选手常常能够击败国际象棋大师,即使大师们被计算机选手让了很多子也无济于事。

但仍有一部分人还在玩一种他们称为“高级国际象棋”的游戏。高级国际象棋中,人类选手与计算机一起行动,找出最佳的落子位置。计算机擅长应对复杂的战术情景,但在长期战略方面比不上人类。最佳的高级国际象棋对局是,计算机选手被用来降低(或者消除)失误,而人类选手则会用他们的直觉来迫使对手进入对方的计算机选手没有怎么见过的战局状态。

这意味着什么?

这意味着人类-计算机的交互对于人工智能来说比我们想象的要重要得多。在每个例子中(国际象棋,驾驶,Facebook,还有ATM机),确保计算机和人类顺利地一起工作是让这些应用发挥效果的关键。然而,重要的是,虽然和人类沟通与和计算机沟通的交互界面是不同的,但是是人类与机器的协作——而不是有一方完全凌驾于另一方——才能带来最佳的结果。

人工智能已经来临,它正在改变事物运作的方方面面。但它并不是在取代人类们的工作和职业。它是在通过处理简单的任务、观察困难的任务并从中学习,来让每个行业、每个职业的人类们都能有更高的工作效率。这也就是说:我们并不会在某天一觉醒来突然发现汽车会自动驾驶了——我们会慢慢让它一点一点地学习掌握。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-11-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

给自动驾驶一双通天眼——环境感知器篇

? 视频是Tesla自动驾驶简述 给自动驾驶一双”通天眼” ...

9885
来自专栏大数据文摘

立下新年flag之前 先看看如何用数据督促自己完成年度计划

1597
来自专栏大数据文摘

前沿 | 国际可视化盛会PacificVis2017的十个精彩案例

2457
来自专栏大数据文摘

如何用数学知识提升情商?数学学霸们的6大思维习惯

1545
来自专栏AI科技评论

深度丨滴滴研究院副院长叶杰平:揭开滴滴人工智能调度系统的真面目

AI 科技评论按:腾讯大数据峰会暨 KDD China 技术峰会中,滴滴研究院副院长、密歇根大学终身教授叶杰平博士非常全面地解密了机器学习在滴滴中的大规模应用,...

37610
来自专栏大数据文摘

学界 | 离开实验室的材料科学:AI正将新材料的发现过程提速200倍

1514
来自专栏量子位

高精地图对自动驾驶有多重要?和一般导航地图有何区别?

作者:陈光 上汽集团 | 高精度地图&环境建模工程师 量子位 已获授权编辑发布 转载请联系原作者 在社交媒体上红极一时的Tesla AutoPilot功能,并还...

3955
来自专栏人工智能快报

谷歌人工智能技术可准确识别蛋白质,有助药物研发

谷歌大脑(Google Brain)团队2018年7月12日宣布成功研发出识别蛋白质结晶的计算机视觉技术,成功率约94%。蛋白质结晶决定了细胞形状,对多种疾病的...

732
来自专栏新智元

【智驾深谈】自动驾驶潜在突破点:传感器与车载集成系统(万字干货)

作者:黄武陵 【新智元导读】黄武陵从事无人车系统研发、无人车标准评估体系构建、无人车挑战赛等工作多年,每次发表观点都非常详尽,本文从自动驾驶近期热点入手,结合挑...

40210
来自专栏华章科技

阿里巴巴为什么要选择星际争霸作为AI算法研究环境?

《星际争霸》一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协...

591

扫码关注云+社区