【人在环中】机器学习的未来

现在机器学习已经变得越来越主流,一些设计模式渐渐浮现。作为CrowdFlowe的CEO,我与许多构建机器学习算法的公司合作过。我发现了在几乎任何一个成功将机器学习应用于复杂商业问题的案例中,都有“人在环中”的运算。它是这样的:

首先,一个机器学习模型先对数据,或者每一个需要标记的视频、图片和文件,做处理。这个模型也给出了一个置信分数(confidencescore),表示这个算法有多大可能做出了正确的判断。

如果置信分数低于了某个值,它会把数据发送给人类,让人类做判断。人类做出的这个新判断既会被应用于处理过程中,也会被输入算法中、让算法更智能。也就是说,当机器不确定答案的时候,它求助于人类,然后将人类给出的判断加入自己的模型中。

这个简单的模式是许多出名的应用于实际案例的机器学习算法的核心。它解决了机器学习最大的问题,即:让一个算法达到80%的准确率非常简单,但要让它达到99%却几乎是不可能实现的。这种机器学习模式让人类来处理那20%的内容,因为仅仅80%的准确率对大部分实际应用来说是不够的。

自动驾驶汽车

自动驾驶汽车是解释“人在环中”运算的一个很好的例子。聪明的人们已经花了许多许多年来研制自动驾驶汽车,这方面最新的科技也的确非常好了。但非常好仍然不够好。99%的准确率意味着人们在1%的时间里可能会死去。

特斯拉最近启动了一个根据人在环中模式制作的自动驾驶模式。特斯拉汽车大部分时候在高速公路上自动行驶,但它坚持要求人类驾驶员手握方向盘。当视觉的机器学习系统感知到对情况有困惑——可能前方有施工,雪,或者什么不寻常的东西——它把控制权转交回人类司机手中。所以虽然特斯拉汽车的确可以在几乎大部分时候都自动驾驶,它也需要人类为它防止可能的故障。想想要是没有这一点约束的话可能有什么后果吧,然后你就明白它存在的原因了。

在Facebook的照片上标记朋友

Facebook的照片识别算法已经特别棒了。事实上,当你上传了照片,它通常不仅能找到照片上的人脸,还能够以97.25%的准确率猜出这个人是谁。

但有些时候,当它的置信分数低于一定水平,Facebook会询问作为上传者的你,确认照片中标记的人有没有错。当置信分数更低的时候,它会让你来标记照片中的人。所有这些人类给出的信息都会返回到算法中,让算法变得更好。

ATM

曾经,当你用ATM机存支票的时候,你需要告诉它支票上有多少钱。但随着光学字符识别(OCR)技术的巨大进展,通常来说,你的ATM机会使用视觉算法,不仅了解到支票数额,还能知道其他相关信息,例如汇款路线号码(routingnumber)。

这些视觉算法解决了很多问题,不过仍然有一些时候手写字符太过奇怪或者不是常用语言。在这些情况中,你的ATM机会让你输入数额,而这张支票会被传送给人类来识别(这就是为什么一些支票会比其他支票处理时间更长)。就像Facebook的例子那样,你输入的数额给了视觉算法更多数据来学习。

高级国际象棋

许多年前“深蓝”击败了Kasparov,这是AI的巨大胜利。从那时起,国际象棋计算机选手无疑就变得来越多。虽然国际象棋被“彻底解决”仍然是一件相对遥远的事(至少有1043种棋盘位置需要纳入考虑),但计算机选手常常能够击败国际象棋大师,即使大师们被计算机选手让了很多子也无济于事。

但仍有一部分人还在玩一种他们称为“高级国际象棋”的游戏。高级国际象棋中,人类选手与计算机一起行动,找出最佳的落子位置。计算机擅长应对复杂的战术情景,但在长期战略方面比不上人类。最佳的高级国际象棋对局是,计算机选手被用来降低(或者消除)失误,而人类选手则会用他们的直觉来迫使对手进入对方的计算机选手没有怎么见过的战局状态。

这意味着什么?

这意味着人类-计算机的交互对于人工智能来说比我们想象的要重要得多。在每个例子中(国际象棋,驾驶,Facebook,还有ATM机),确保计算机和人类顺利地一起工作是让这些应用发挥效果的关键。然而,重要的是,虽然和人类沟通与和计算机沟通的交互界面是不同的,但是是人类与机器的协作——而不是有一方完全凌驾于另一方——才能带来最佳的结果。

人工智能已经来临,它正在改变事物运作的方方面面。但它并不是在取代人类们的工作和职业。它是在通过处理简单的任务、观察困难的任务并从中学习,来让每个行业、每个职业的人类们都能有更高的工作效率。这也就是说:我们并不会在某天一觉醒来突然发现汽车会自动驾驶了——我们会慢慢让它一点一点地学习掌握。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-11-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

NIPS 2017 | 清华大学人工智能创新团队在AI对抗性攻防竞赛中获得冠军

2989
来自专栏量子位

阿里达摩院开源语音识别模型DFSMN,准确率达96.04%

近日,阿里达摩院机器智能实验室开源了新一代语音识别模型DFSMN,基于世界最大的免费语音识别数据库LibriSpeech,该模型将全球语音识别准确率纪录提高至9...

1192
来自专栏机器之心

专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?

机器之心专栏 作者:李玉喜 AlphaGo 与世界第一的人类棋手柯洁的对弈比赛已经引起了全世界的广泛关注。不出意外,尽管柯洁表现出色,但 AlphaGo 仍然...

3706
来自专栏AI科技大本营的专栏

量子计算+人工智能——这才是未来科技的最大热门!

编译 | AI科技大本营 参与 | shawn 编辑 | 明明 90年代初,当卫奇塔州立大学(Wichita State University)的物理学教授El...

3817
来自专栏机器之心

业界 | Graphcore提出IPU基准:全面测试硬件运行机器学习应用能力

2898
来自专栏人工智能头条

讲真?一天就学会了自动驾驶——强化学习在自动驾驶的应用

1002
来自专栏AI科技评论

业界| 小米宣称人脸检测算法准确率位列FDDB全球第一

昨日下午,小米科技联合创始人黄江吉在微博上宣布,小米人脸检测新算法在FDDB(基于深度卷积网络:Faster RCNN Bootstrapped by Hard...

3309
来自专栏ATYUN订阅号

使用深度学习的方法来创建专业级别图片

机器学习(ML)在许多领域都做得十分出色。学习任务中如果存在正确或错误的答案是有助于训练过程的,并且允许它的算法实现其期望的目标,无论是正确地识别图像中的对象目...

34710
来自专栏新智元

谷歌DeepMind连续深度学习网络PNN,距人类水平AI又进一步

2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容...

3253
来自专栏机器之心

学界 | AAAI 2018获奖论文提前揭晓:两大奖项花落阿尔伯塔、牛津

3054

扫码关注云+社区