号称要取代人类的AI技术真的省下了人力吗?

源singularityhub译章成超

在人工智能的大风之下,越来越多的科技公司大力吹捧着自己自动化的能力——用程序代替低效又昂贵的人力。但在这种背景下,很多训练机器学习系统,在解决问题软件不能解决的问题和清理数据时,还是得靠人力来完成。

最近,一家以图像识别为基础,扫描图像数据来得出报告的公司Expensify,被指出将用户提供的数据转给了 Amazon 的 Mechanical Turk (MTurk) 众包平台上的工作人员。

该公司使用文本分析软件来读取收据,但是如果自动化系统失败了,图像将转给真人进行审查。将这项工作委托给 MTurk 的随机工作人员很不明智,毕竟客户的素材中可能包含隐私。Expensify 在此之后马上停止了这种做法。这个事件也表明了,人工智能服务背后的人类安全网络实际上非常普遍。

正如 Wired 的一篇文章指出的那样,像 Ibotta 和 Receipt Hog 这样的收集收据信息用于营销目的的类似服务也常常使用到众包工作者。同样,虽然大多数用户可能会认为他们的 Facebook 新闻流是由算法管理的,但其实 Facebook 也在增加人力调节员的数量,以捕捉通过网络中 —— 如 YouTube 上的色情暴力视频。而国外版微博,Twitter,同样有着数以千计的人力监督员。

而人类也并不是总知道自己被 “利用” 了——Google 用来区分人类和机器的验证程序 reCAPTCHA,实际上就通过让人们识别机器难以解读的文本来数字化书籍。

卡耐基梅隆大学(CarnegieMellon University)众包专家 Jeffrey Bigham 说:“每个使用 AI 的产品都会用到大量人力,我甚至想说它是这个过程的核心部分。”

有些公司并不羞于使用人力。新兴公司 Eloquent Labs 希望将他们的客服机器人插入到用户和客服之间。人工智能很多时候都能准确地完成一个明确的任务,这种介入能将用户快速分类,比服务代理更便宜。

时装零售商 Gilt 提供 “抢先式运送(pre-emptive shipping)”,它使用数据分析来预测人们的购物意愿。该公司使用 MTurk 的众包来识别对服装的主观评论数据,然后输入他们的模型。

MTurk 不是唯一的玩家。像 CloudFactory 和 CrowdFlower 这样的公司提供的众包人力针对了各种特定的细分市场,还有一些公司更愿意维持自己的人工社区。

大多数时候,这些人力资源工作者不仅填补了空缺,他们还通过提供如何解决问题的新例子来帮助训练这些公司服务的机器学习组件。其他时候人类不是人工智能系统的 “其中一环”,而是通过标记图像,文本或音频来 “提供” 数据集给系统学习。

甚至有可能使用众包工作人员来执行通常由机器学习解决的任务,例如大规模的图像分析和预测。

Zooniverse 让科学家对遥远的星系或动物的视频图像进行分类,以帮助学者分析大型数据集。Almanis 通过给那些在网站上注册的人提供激励来支持问题的正确答案,从而以引人瞩目的准确度创造了从经济到政治的所有事物的预测。研究人员已经使用 MTurkers 来提供一个聊天机器人,甚至还有一个工具包用于构建算法来控制这个被称为 TurKit 的人类智能。

那么人工智能服务中人类扮演重要角色意味着什么呢?首先,这表明人们所认为的许多工具都是由人工智能驱动的,实际上可能依赖于人类。这个问题具有明显的隐私意义,正如 Expensify 的故事所强调的那样,但是也应该更加关注顾客是否真正得到和他们的付出所相对应的东西。

其中一个例子就是 IBM 的 Watson 肿瘤,它作为一个数据驱动的人工智能系统销售,用于提供癌症治疗建议。但是STAT的一项调查强调,这实际上主要是由纽约 Memorial Sloan Kettering 癌症中心的一些(高度熟练的)医生的推荐推动的。

其次,人工介入人工智能运行的过程也表明,没有我们,人工智能仍然在很大程度上是无助的,这是在知道了人工智能摧毁工作机会这些世界末日预言后能稍微令人感到欣慰的。但同时,这些众包工作大部分是单调、收入不高且孤立的。

由于受到人类工作者训练的机器在各种任务中都有了较好的表现,这种弥补其在能力差距上越来越小的零散工作可能会更加普遍。虽然科技公司经常谈论人工智能增强人类智能,但对于许多人来说,实际上最终可能是相反的。

-END-

译者 章成超

最爱瞎扯言不足,计算机里玩数独。

了解如何加入我们

本文来自企鹅号 - 小象媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏about云

大数据架构师、开发人员、公司必读:国外大数据应用的10个项目案例(图表)

问题导读 1.大数据如何应用于电力能源项目,带来效益? 2.数据可视化有哪些应用? 3.是否可以将可视化应用于空气污染? 4.大数据如何应用于各种(手机)应用...

419100
来自专栏新智元

2016 年人工智能最重要的发展:面向所有人的深度学习

【新智元导读】过去一年人工智能和深度学习最重要的发展不在技术,而是商业模式的转变。过去6个月,所有巨头都将自己的深度学习IP开源。Data Science Ce...

33370
来自专栏华章科技

史上最全人工智能和机器学习会议大盘点

大名鼎鼎的神经信息处理系统大会(Neural Information Processing

21520
来自专栏科技向令说

阿里钉钉和企业微信铺天盖地,大象盯盯专注产品,还有前途吗?

2016年的企业级SaaS市场注定非同凡响,就在这个千亿级市场,各路英雄好汉打得不可开交,阿里钉钉、企业微信、腾讯企点等背靠巨头“横冲直撞”,和创(红圈营销)、...

9720
来自专栏AI科技大本营的专栏

资源|2018年14个顶级AI和机器学习会议名录

编译 | AI 【AI科技大本营导读】人工智能和机器学习已经跳出科幻小说的范畴,冲进了现实。不管是技术层面还是商业环境方面,这些领域都在迅速发展,紧跟潮流的步伐...

39060
来自专栏区块链入门

金融行业如何用大数据构建精准用户画像?

用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出...

25510
来自专栏腾讯大讲堂的专栏

2017腾讯创新日 | 科技引领潮流,创新打造未来

创新充满挑战,科技提供更多可能,随着社会的不断前进,科技、创新越来越深入我们的工作和生活中。勇于挑战自我、专研业务技术的腾讯人在6.14日举办了2017年“腾讯...

39060
来自专栏数据派THU

【独家】DataVisor:基于Spark平台的智能大数据网络反欺诈(视频+PPT+课程精华笔记)

[导读]为了让清华大学大数据能力提升项目的学生在基础学习和科研的基础之上,更好地了解大数据技术行业领域中的应用,清华-青岛数据科学研究院支持开设了金融大数据方向...

39280
来自专栏华章科技

2016 年人工智能最重要的发展:面向所有人的深度学习

过去一年人工智能和深度学习最重要的发展不在技术,而是商业模式的转变。过去6个月,所有巨头都将自己的深度学习IP开源。Data Science Central 网...

6920
来自专栏AI研习社

转行人士如何在人工智能领域保持一定的竞争力?

原问题描述: 没有学术认可:转行意味着没有相关领域的论文记录和对应的学位,即便水了一篇,被学术界认可的概率很低。而且码力有限,只要科班一直保持写码学习,写码速度...

379110

扫码关注云+社区

领取腾讯云代金券