专栏首页AI科技大本营的专栏李飞飞最新论文:用算法判断政治倾向(附论文链接)

李飞飞最新论文:用算法判断政治倾向(附论文链接)

翻译 | SHAWN

编辑 | Donna

斯坦福大学的研究人员开发出了一种可以进行观察和学习的算法,他们用这种算法分析了百万张公开的Google街景(Google Street View)图像。经过这种训练后,算法可以识别给定社区的车辆,判断社区居民的政治倾向

从低调奢华的宾利到可靠的家庭休旅车,再到实用的皮卡,美国人深知汽车能反映车主的性格。正如那句西方谚语所说:You are what you drive(人如其车)。斯坦福大学的研究人员将这句谚语的含义延伸到了新的层面——开什么车代表你投哪个党的票

研究人员用可以进行观察和学习的计算机算法分析了数百万张公开的Google街景图像。他们发现,算法可以利用学到的知识研究给定社区的车辆,以此判断该社区居民的政治倾向。

李飞飞,斯坦福大学计算机科学副教授、斯坦福大学人工智能实验室及视觉实验室主任

这项研究由李飞飞所在的视觉实验室主导。李飞飞表示:

借助唾手可得的视觉数据,我们可以充分地了解我们的社区。相比之下,花费数十亿美元进行普查反而只能获得一点信息。更重要的是,这项研究让人们更加相信我们可以利用廉价易得的视觉数据进行社会研究。

“算法经过训练”,更准确地说,是算法经过自我训练后,可以识别5千万张Google街景图像(拍摄于200个美国城市)中每辆1990年后生产的汽车的车型、型号和出厂年份。

然后,将车型和位置数据分别与当前最全面的人口统计数据库American Community Survey(美国社区调查数据库)及总统选举投票数据作对比,以此估计种族、受教育水平、收入和选民偏好等人口要素。

李飞飞和她的团队发现:汽车、人口统计数据和政治倾向之间存在着某种简单的线性关系。他们11月28日在《美国国家科学院院刊》上发表的论文是这样描述的,这三者之间的社会关系“虽然简单但很重要”。

举例来说,如果某一社区中轿车比皮卡多,该社区的居民有88%的概率会投票给民主党;如果皮卡比轿车多,居民则有82%的概率会投票给共和党。

及时和连续的数据更新

抛开明显的政治影响不说,研究人员认为他们的算法还可以为当前的人口调查数据提供更加及时、更加连续的补充数据。目前,美国社区调查采用的方法是挨门逐户地进行民意调查,这种调查方法昂贵且耗费人力。美国政府每年在这项调查上的花费超过2.5亿美元。并且,即使已经花费如此巨额,数据收集和数据公布之间的时间间隔仍长达两年之久甚至更长,尤其是在小城市和乡村地区。

相比之下,李飞飞等人开发的算法利用免费公开、定期更新的Google街景图像数据库,几乎可以实时生成分析数据。

该论文的第一作者、前斯坦福大学视觉实验室成员Timnit Gebru称:“我并不认为这样的技术可以取代“美国社区调查”,但是可以作为该调查的补充和对数据进行更新。” Gebru现在在微软研究院的人工智能公平、责任、透明性和伦理(Fairness Accountability Transparency and Ethics in AI,FATE))小组担任博士后研究员。

Gebru表示做到这一步并不容易。首先,团队必须为所有1990年后生产的汽车手工构建一个图像数据库,标记每辆汽车的出厂年份、车型、型号、车饰信息,然后训练计算机识别图像中不同汽车之间的细微差别,这些图像的成像质量和拍摄角度并不理想。

细微差别

开始时,研究人员用汽车销售网站Edmunds.com 上的15000种车型构建了一个数据库,但是这只是开始。接下来,人类专家必须根据细微差别对这些车型进行逐一分类。举例来说,2007版和2008版本田雅阁(Honda Accord)只有尾灯稍微不同,两者之间的差别几乎无法察觉。

但是,算法的工作效率非常高,只花了两周的时间就根据车型、型号和出厂年份将5千万张图像分为2657个类别。相比之下,即使是工作效率较高的人类专家,每分钟也只能分类6张图像,完成同一任务需要花费多达15年的时间。

论文发出后,一些业内人士提出质疑。他们认为,由于这些图像的拍摄时间不一致,可能会影响算法对交通模式和汽车外观的识别。对此,Gebru表示,为了避免交通,许多Google街景图像实际上都是在早上拍摄的,因此图像在拍摄时间上存在一定的一致性。无论拍摄时车流量如何,这些图像都能够提供非常宝贵的数据。

旧金山某一居民区的Google街景图

Gebru说:“如果你在一个居民区观察过往车辆,有时车流密度所能提供的信息和车型提供的信息一样宝贵。所有这些信息都可以为算法所用”。

对这项研究的新应用,Gebru持有很高的期望。除了用于人口统计,视觉图像分析技术还可以用于改进对偏远地区的调查以及用于其他用途,例如:监测二氧化碳水平和缓和交通拥挤。

李飞飞也表示赞同:“计算机视觉技术可以帮助我们理解社会的运作方式,人们的需求以及如何改善人们的生活。这项技术有很大的潜力,它可以为我们带来很多好处。”

李飞飞还是斯坦福大学Bio-X研究中心和神经科学研究所的成员。这篇论文的作者还包括斯坦福大学研究生Jonathan Krause、Yilun Wang、 Duyun Chen以及密歇根大学和贝勒大学的同事。

作者 | ANDREW MYERS 原文地址: https://news.stanford.edu/2017/11/28/neighborhoods-cars-indicate-political-leanings/?linkId=45266775 论文链接: http://www.pnas.org/content/early/2017/11/27/1700035114.full.pdf

本文分享自微信公众号 - AI科技大本营(rgznai100),作者:紧跟热点

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Google AI的焦虑:拆分搜索和人工智能部门,Jeff Dean任AI业务负责人

    作者 | 费棋 美国时间 4 月 2 日,据 The Information 报道,Google 证实将搜索和人工智能业务分拆为两个独立部门,该公司网络搜索业务...

    AI科技大本营
  • 听说,Google又入华了?

    9 月 4 日晚,“首都在线云计算”公众号发布一篇题为《Google 云正式进驻中国,创建美好云世界》的文章,称 Google 云正式确定通过首都在线将其云业务...

    AI科技大本营
  • TPU 3.0,Android P...Google带来了哪些惊喜?

    北京时间 5 月 9 日凌晨, Google I/O 2018 开发者大会的 7000 人会场又一次座无虚席。因为 Google 的“AI First”已经进入...

    AI科技大本营
  • 深度实践:如何用神经网络给黑白照片着色

    现如今,将图片彩色化是通常用Photoshop处理的。一幅作品有时候需要用一个月的时间来着色。可能单单一张脸就需要20层的粉色、绿色和蓝色阴影才能让它看起来恰到...

    AiTechYun
  • Google最新GMS政策将要实施!

    也就是从明年3月份起,如果设备厂商没有通过GMS认证,Google会强制推送消息,告知用户设备为非认证设备。 Android6.0及以下版本只提示用户。Goog...

    安智客
  • 知识总结:安卓工程师养成计划计算机基础细分方向知识算法

    楼主Android菜鸡一枚,今年校招侥幸拿到了还不错的offer。因为校招实在过于侥幸,面试上很少遇到复杂的问题,这里就不写面经了,初略谈一谈校招的一些准备吧。...

    牛客网
  • 干货 | 证件全文本OCR技术,了解一下

    携程技术
  • MySQL 5.7中锁的一个通用问题

    前几天分析了一个死锁的问题,有一个网友看了以后,就发了邮件给我问一个问题。一般来说,能够发送邮件提出问题的同学,都是很认真的,因为他要准备好日志,准备好操作过...

    jeanron100
  • 今天 Google 回来了,好像又走了

    非著名程序员
  • typeof和instanceof原理

    这里的类型值是值,变量是没有类型的,变量可以随时持有任何类型的值。JavaScript中变量是“弱类型”的,一个变量可以现在被赋值为 字符串类型,随后又被赋值为...

    木子星兮

扫码关注云+社区

领取腾讯云代金券