前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >李飞飞最新研究成果!斯坦福正在用算法判断政治倾向

李飞飞最新研究成果!斯坦福正在用算法判断政治倾向

作者头像
量子位
发布2018-03-23 14:34:57
7300
发布2018-03-23 14:34:57
举报
文章被收录于专栏:量子位量子位
李杉 编译 news.stanford 量子位 出品 | 公众号 QbitAI

“什么样的人,开什么样的车。”

宾利、MPV、皮卡,不同的汽车都能透露出车主的个性差异。

而斯坦福研究人员则将这种思维更进一步:通过对谷歌街景中的海量图片进行识别和分析,他们便可借助某个社区的汽车判断当地人的政治倾向。

“使用可以轻易获取的视觉数据,我们便可对自己的社区展开很多了解,堪比花费数十亿美元通过人口普查获得的一些信息。更重要的是,这项研究打开了更多可能,让我们可以使用很便宜的视觉数据对社会展开持续不断的研究。”斯坦福大学计算机科学副教授兼斯坦福人工智能实验室主任李飞飞说。

斯坦福计算机科学副教授兼斯坦福AI实验室主任李飞飞

李飞飞是计算机视觉和深度学习领域的专家,这种技术可以教给电脑自己在2D图像中识别3D物体——按照他们的说法,就是让计算机可以看见东西。

这种算法会接受训练(更准确地说是自我训练),通过这种方式来识别200个美国城市的5000多万张谷歌街景图片,从而在其中认出从1990年以来的每一个车型。

之后将车型和位置数据与两个数据库进行对比,一个是当今最全面的人口统计学数据库美国社区调查(American Community Survey),另外一个则是美国总统大选投票数据库,其中包含了种族、教育、收入和投票倾向等信息。

李飞飞和她的团队发现汽车、人口统计学信息和政治派别之间存在简单的线性关系。他们在11月28日发表在《美国国家科学院院刊》上的论文中表示,这种社会关系“简单而强大”。

例如,如果一个社区的轿车数量多于皮卡,那么这个选区就有88%的概率支持民主党。如果皮卡多于轿车,那就有82%的可能支持共和党。

旧金山居民区街景(Google街景)

数据更新及时且持续

除了明显的政治影响外,研究人员还认为,他们的算法有助于对现有的人口调查提供及时而持续的补充。

美国社区调查目前是通过成本高昂的上门访谈来实现的,每年花费超过2.5亿美元。即便通过如此高昂的成本,从数据收集到正式发布仍然存在一定的延迟,可能达到两年甚至更多,尤其是在小城市和乡村地区。

相比而言,李飞飞的这种算法可以使用定期更新的公开数据库,几乎可以实时得出分析结果。

“我不认为这可以取代美国社区调查,但却可以成为一种补充,保持数据更新。”李飞飞实验室前成员、该论文的第一作者Timnit Gebru说。Gbru目前是微软研究院人工智能事业部的博士后研究员。

Gebru表示,要实现这一目标并非易事。该团队首先必须手动构建一个包含1990年以来的所有汽车的数据库,然后交给电脑如何识别不同车型之间的细微差异,尤其是在一些模糊的图像中。

算法更能洞察细节

他们首先从汽车销售网站Edmunds.com上获得了1.5万辆汽车的数据库,但这只是个开始。人类专家接下来还要逐一按照细微差别对汽车进行归类。例如,2007和2008款本田雅阁之间的差异只体现在尾灯上。

算法速度很快,只需要两个星期就能按照品牌、型号和年限将5000万张图片中的汽车分成2657个类别。即使速度较快的人类专家也只能每分钟分类6张照片,需要15年才能完成同样的任务。

Gebru表示,有的外部研究人士对此表示质疑。他们指出,照片拍摄时间的不同会对交通状况和汽车构成产生影响。Gebru补充道,为了避开拥挤的交通,很多街景照片都是早晨拍摄的,这便可以提升照片的一致性。无论交通状况如何,这些图片都能提供有价值的数据。

“如果你在社区走一走,看看那里的汽车,车流密度有的时候可以比车型提供更多信息。”Gebru说,“算法可以对这些信息加以利用。”

Gebru对她的这项新应用有着很高的期望。她希望能够突破人口统计的局限,用视觉分析针对难以达到的领域改进调查结果,或者用于监控二氧化碳浓度和缓解交通拥堵。

李飞飞也认同这种看法。“它能帮助我们理解社会的运作状况,理解人们的需求,以及我们如何改善生活。”她说,“计算机视觉技术在建设性的方面和慈善领域有很大的应用前景。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据更新及时且持续
  • 算法更能洞察细节
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档