学界 | 李飞飞最新论文:结合深度学习和谷歌街景来估算美国人口结构

AI科技评论按:最近,一篇名为《Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US》的论文发布到了arxiv.org上,作为这篇论文的联合作者之一,李飞飞在她的推特上向公众推荐了这篇论文。这篇论文主要论述了如何将谷歌街景车搜集来的机动车辆数据,结合机器学习算法,从而估算出本地区人口的特征和组成,甚至这一地区居民的政治倾向。

下面是这篇论文的一些节选内容,原文地址为:https://arxiv.org/abs/1702.06683。由AI科技评论编译。

几千年来,统治者和政策制定者进行全国人口调查,用来搜集人口数据。在美国,最细致的人口调查工作就是“美国社区调差”(ACS),由美国普查局执行,每年花费10亿美元和6500人以上的人力。这是一个劳动密集型数据搜集过程。

最近几年,计算方法崛起成为解决社会科学领域问题的有效方法。比如用Twitter上的数据预测失业率、使用书里的大量文本分析文化等等。这些例子表明,计算方法可以促进社会经济领域的研究发展,最终可以详细、实时地分析人口趋势,并且成本很便宜。

我们的研究表明,结合公共数据和机器学习方法,可以得到社会经济数据和美国人的政治倾向。我们的流程里,针对几个城市耗费少量人力来搜集数据,然后用来预测全美的状况。

具体而言,我们分析了由谷歌街景汽车在200个城市里搜集来的5000万张图片。我们的数据主要是关于机动车辆,因为90%的美国家庭都拥有至少一辆汽车,而且人们对汽车的选择受到多种人口因素的影响,包括家庭需求、个人偏好和资金等。

基于深度学习的CNN计算机视觉框架,不仅能够在复杂的街景下识别出汽车,还能鉴定出一系列汽车特征,包括材料、型号和年份。对于一个未经训练的人来说,汽车之间的不同是难以发觉的。比如,同一型号的汽车,不同年份的在尾灯有微小变化(比如2007产的Honda Accord和2008年产Honda Accord)。然而,我们的系统就能够将汽车分成2657类,每张图片的分析时间只需0.2秒。该系统可以在2周时间里对5000万张图片分类,而一个专业的人类分类员,假设他每张需要10秒时间,将会花费15年的时间完成这个任务。

利用谷歌街景汽车搜集来5000万张图片,我们使用图像识别算法(Deformable Part Model)来学习自动搜集汽车图片。搜集每一辆汽车图片后,我们部署CNN模型,用来进行物体分类,来判定每一辆车的材料、型号、车型和年份。然后,我们根据城镇名字分类数据库,划分到两个数据库里。第一个是"训练库",包含了所有名字以A、B、 C开头的地区,这个数据库包括了35个城市,训练产生模型;第二个是“测试库”,包括所有名字以D、Z为开头的地区,这个数据库用来提升模型。

我们总共搜集了2200万辆(占全美汽车总数8%)汽车的数据,用来准确估算这个地区的收入、种族、教育和投票程式(voting pattern)。结果显示出的关系出人意料的简单和有力。比如,如果在一个城市里15分钟的车程中,遇到的轿车数量高于卡车数量,那么这个城市倾向于在下届大选中投票给民主党(88%几率);反之则倾向于投票给共和党(82%)。我们的结果表明,自动系统监测使用良好的空间分辨率,能够接近实时地监测人口趋势,可以有效地辅助劳动密集型的调查方法。

卷积神经网络早在1975年就被提出,而在1995年被正式命名,又在2012年因Hinton团队ImageNet大赛夺冠而闻名,2016年的阿尔法狗更是将人工智能推上了高潮。邓志东教授从事包括深度神经网络在内的人工神经网络研究25年,在清华授课20余年,他在一线教育上感受到的人工智能发展比我们更加汹涌。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-02-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

三大技术基础推动人工智能走向实用

人工智能从幕后走向实用离不开人工智能技术取得的突破和发展。在互联网时代背景下,大数据、新型高性能计算架构以及深度学习帮助人工智能技术实现了从量变到质变的转变。其...

2769
来自专栏新智元

计算机视觉中的深度学习:技术、市场和5个你想不到的未来

【新智元导读】本文从算法、市场及硬件三个角度观察深度学习对计算机视觉的影响,并补充完整视频。谷歌TensorFlow移动端和嵌入式应用团队负责人Pete War...

3197
来自专栏AI科技评论

地平线机器人CEO余凯:人工智能和深度学习的下一个风口在哪(含22页PPT)

雷锋网按:本文根据余凯在微软亚洲研究院召开的“让世界充满 AI-人工智能研讨会”上所做的报告《 “AI Inside”无处不在的未来 》编辑整理而来,在未改变原...

3344
来自专栏AI科技大本营的专栏

AI算法起家的今日头条为何败给了色情?一文告诉你机器学习何以搞不定鉴黄

12月29日,国家互联网信息办公室在官网发布消息称,针对今日头条、凤凰新闻手机客户端持续传播色情低俗信息、违规提供互联网新闻信息服务等问题,要求北京市互联网信息...

3588
来自专栏新智元

【iPhone X重磅发布】携A11人工智能芯片登场,人脸识别9大特征

【新智元导读】苹果13日凌晨发布了本年度最重量级的产品——iPhone X (iPhone 10)。这款用人脸识别进行解锁的新iPhone 可能是苹果AI属性最...

2606
来自专栏新智元

【重磅】计算机视觉中的深度学习:技术、市场和5个你想不到的未来

【新智元导读】本文从算法、市场及硬件三个角度观察深度学习对计算机视觉的影响。以下三个视频中,谷歌TensorFlow移动端和嵌入式应用团队负责人Pete Wa...

3225
来自专栏PPV课数据科学社区

【学习】如何利用互联网文本语义分析进行金融量化投资?

1.金融文本挖掘背景介绍 文本挖掘作为数据挖掘的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页中的论坛、微博、新闻等。文本挖掘是...

2196
来自专栏机器之心

业界 | 京东金融与KDD2018:如何针对性解决城市计算痛点

作为会议的承办方,京东金融的城市计算事业部在会议上给出了一个主题演讲和两篇论文介绍,分享了京东进行城市计算的方法论,辅以众多实际案例。

760
来自专栏新智元

【技术探讨】拿 AlphaGo 做投资会怎样?

在AlphaGo战胜人类围棋顶尖高手之际,本文简单探讨了投资AlphaGo系统模块与训练数据以及可行性。并将其实现逻辑与郝伯特·西蒙过程理性算法比较。文章最后讨...

3497
来自专栏DT数据侠

张翰娜扎为何分手?这个“科学配对实验”已洞穿一切

连张翰娜扎这种外形登对的高颜值组合都宣告分手,圣诞节独守空房的你有什么资格老泪纵横。在这个什么都讲究精准配对的时代,遇不到真爱可能真的是概率问题。

560

扫描关注云+社区