李飞飞高徒新项目,一眼看穿你下届总统会选谁!

翻译 | AI科技科技大本营

参与 | 刘畅

编辑 | Donna

和很多人一样,我们会通过一个人的外表和穿着来判断其经济能力,也会通过字迹来判断其品性。但这篇文章中,斯坦福大学研究人员会通过你所开的车辆类型来判断你可能会在下届总统选举中将票投给川普还是希拉里。

从根本上说,这个研究或者这个结果并不是最近才出现的,市场研究人员和政治分析家已经研究这个问题几十年了,而斯坦福大学更多是借助人工智能在研究方法上进行了创新。

研究介绍

该项研究由李飞飞博士斯坦福AI Lab的学生Timnit Gebru主持。该研究通过算法分析了来自谷歌街景(Google Street View)中的5000万个图像和位置数据,从图像中提取车辆的品牌,型号和年限。经过训练后,算法可以识别给定社区的车辆,判断社区居民的政治倾向。

得益于人工智能方面的最新进展,研究人员第一次能够分析大量的图像,提取可以分类和挖掘的数据,来进行预测收入,政治倾向和购买习惯等事情。

这项研究用到了谷歌街景收集的5000万幅街景图,一共识别了2200万辆汽车,然后被分类到超过2,600个类别,如制造商和型号,位于3000多个邮政编码和39000个投票区。

研究人员招募了数百人对数百万张照片中的汽车进行挑选和分类。一些在线承包商做了一些简单的任务,例如识别图像中的汽车。而其他人则是汽车专家,他们知道一些很细微的差别,比如2007年和2008年“本田雅阁”尾灯的细微差别。

一旦汽车图像工程建成,其速度和预测准确性是非常令人震惊的。它在两周内成功的将五千万张图像中的汽车图像进行分类。如果是一个人类专家进行分类,即使每个图像花费10秒,也需要超过15年。

贝勒医学院基因组研究中心的计算机科学家埃雷兹·利伯曼·艾登(Erez Lieberman Aiden)说:“突然之间,我们可以用对文字分析的那套方法对图像进行同样的分析”。

Lieberman Aiden先生说,对于计算机而言,同人一样,阅读和观察是理解世界的两种截然不同的方式。 从这个意义上说,“计算机就没有理解世界的短板了”。

社会意义

识别如此多汽车图像中的细节是一项非常难的技术,更可贵的在于它将新的数据集与社会经济和环境信息的公共集合连接在了一起,然后调节软件的参数以发现其中信息的模式和相关性。因此,这个项目成为了计算机科学家将图像数据更广泛应用的一个经典案例。

康奈尔科技公司的计算机科学家Serge Belongie曾质疑计算机视觉的快速发展,认为其并不能给社会造成影响:“能够识别照片中的内容并不是能促进我们对世界更科学地理解”。

但是,斯坦福的汽车项目让我们看到了计算机视觉和社会之间的有趣联系,但其实并没有那么多惊人的启示。在最近的一篇论文中,也有关于预测中的相关性的:

  • 该系统能够准确预测全国各城市的邮政编码和选区级别的收入,种族,教育和投票模式。
  • 汽车属性(包括每加仑里程评级)发现,美国最环保的城市是伯灵顿,而卡斯帕是人均碳足迹最大。
  • 芝加哥是收入分配水平最高的城市,在不同地区有大量的昂贵和廉价的汽车。佛罗里达州杰克逊维尔市的收入最少。
  • 纽约是汽车价格最贵的城市。埃尔帕索的悍马比例最高。旧金山的外国汽车比例最高。

其他研究人员已经使用谷歌街景数据为影响城市发展,当地社区的民族变化和公共健康的因素提供了视觉线索。但迄今为止,斯坦福大学的项目似乎在最详细的分析中使用了最多的街景图像。

对这项研究的新应用,Gebru持有很高的期望。除了用于人口统计,视觉图像分析技术还可以用于改进对偏远地区的调查以及用于其他用途,例如:监测二氧化碳水平和缓和交通拥挤。

能否取代传统的统计调查方法?

就像我们说的通过衣着和字迹来判断一个人并不总是凑效,这项研究目前还不能百分百自证完美。目前来说,这项研究仍是传统调研方法的补充方法。

论文的第一作者、前斯坦福大学视觉实验室成员Timnit Gebru称:“我并不认为这样的技术可以取代“美国社区调查”,但是可以作为该调查的补充和对数据进行更新。” Gebru现在在微软研究院的人工智能公平、责任、透明性和伦理(Fairness Accountability Transparency and Ethics in AI,FATE))小组担任博士后研究员。

无法逃避的隐私问题

这项研究只是通过车型预测特定区域的政治倾向,但如果这项研究继续扩展,将会引发数据访问和隐私问题。

斯坦福大学的项目只是预测了社区,而不是个人。 但是在德国和其他地方已经提出了关于街景图片的隐私问题。 对此,谷歌表示,它将根据具体情况来处理关于大量图像数据的研究请求。

随着无人驾驶技术的发展,汽车车载摄像头才刚刚起步。那么,他们收集的大量图像数据是否可用于研究或保留专有权?

如何看待图像识别技术的进步对研究的影响

新生事物总是正反面相伴。一方面我们在质疑研究的可靠性和隐私问题,但另一方面,我们又期待能从中获益。

加州大学伯克利分校人口学教授Kenneth Wachter说,现在基于图像的研究可以帮助公众对抽样调查的回应率下降。 他说,人工智能辅助的视觉人口普查可以填补目前数据中的空白,而且比每十年进行一次的传统人口普查提供更及时的观点,因为这些普查涉及公共政策的热点话题,例如“劣势和机遇的地理和演变。”

哈佛大学计算机科学家兼研究员尼克尔•奈克(Nikhil Naik)在研究城市环境时使用了街景图像,斯坦福大学的这个项目指向了以图像为基础的研究的未来。

Naik先生说:“这是历史上第一次有技术是从大量的视觉数据中提取观点。然而,虽然这项技术令人兴奋,但是计算机科学家需要与社会科学家和其他人密切合作,以确保它是有用的。”

作者 | Steve Lohr 原文 https://www.nytimes.com/2017/12/31/technology/google-images-voters.html

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-01-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【AICC】AI将需要超百万倍计算力,三因素决定深度学习模型计算

【新智元导读】人工智能三大支柱之一的计算目前发展是什么样的?它足以支撑人工智能的火速发展吗,会不会拖后腿,让人工智能的发展停滞?9月7日首届AI计算大会上述问题...

32630
来自专栏AI科技大本营的专栏

AI领域真正最最最最最稀缺的人才是……会庖丁解牛的那个人

图片来源:Wired 【AI科技大本营导读】这里,就不卖关子了。AI领域最最最最最稀缺的人才应该为人工智能架构师。有过4次技术创业经历,如今做AI投资的星瀚资本...

335100
来自专栏大数据文摘

谷歌宣布收购全球最大数据科学社区Kaggle

25480
来自专栏吉浦迅科技

黄仁勋:透过 GPU 加快人工智能运算速度是崭新的运算模型

Yann LeCun 邀请我出席本周在纽约大学举行的首届“人工智能的未来”学术研讨会,人工智能领域的多位重量级人士齐聚一堂,讨论这项技术的现况及未来发展。我在此...

39190
来自专栏企鹅号快讯

为什么神经网络会把乌龟识别成步枪?现在的 AI 值得信任吗?

概要:人工智能的快速发展的确值得欣喜,但快速发展的背后还有各种不完善的地方。 人工智能的快速发展的确值得欣喜,但快速发展的背后还有各种不完善的地方。比如,前不久...

19360
来自专栏企鹅号快讯

李飞飞高徒新项目,一眼看穿你下届总统会选谁!

翻译 | AI科技科技大本营 参与 | 刘畅 编辑 | Donna 和很多人一样,我们会通过一个人的外表和穿着来判断其经济能力,也会通过字迹来判断其品性。但这篇...

22570
来自专栏人工智能头条

人工智能的突破需要颠覆图灵机吗?

19920
来自专栏AI科技评论

洞见|第四范式CEO戴文渊:大数据不再是AI发展瓶颈,未来企业赢在“维度”

雷锋网按:今天大家讨论比较多的人工智能,包括深度学习等这些技术为什么会对我们有帮助?究竟背后在什么地方能够去改变这个世界?在今天于深圳举办的中国人工智能产业大会...

40670
来自专栏AI科技大本营的专栏

开工了!三位大咖给你指路:未来 3~5 年内,哪个方向的机器学习人才最紧缺?

十一长假结束,收心归来,重新投入工作。如何能克服假期综合症呢?如何快速收心?今天营长就携三位大咖来为你打打鸡血,指引指引未来的路。他们将从自身的工作经历和学习经...

442120
来自专栏新智元

滴滴研究院副院长叶杰平:深度学习在交通领域应用潜力巨大【北大AI公开课第9讲】

【新智元导读】 在北大 AI 公开课第9讲上,滴滴出行副总裁、滴滴出行研究院院长叶杰平老师,和北大人工智能创新中心主任、曾经的“百度七剑客”之一雷鸣老师一道,为...

47760

扫码关注云+社区

领取腾讯云代金券