前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Science:用机器学习发现贫穷,准确率高达99%

Science:用机器学习发现贫穷,准确率高达99%

作者头像
新智元
发布2018-03-23 11:37:39
9520
发布2018-03-23 11:37:39
举报
文章被收录于专栏:新智元

要解决世界上的问题,必须知道问题发生在哪里。因此,联合国要解决世界贫困问题,追踪非洲的贫困情况就非常重要。然而,实地搜集数据可能很危险,而且效率缓慢、成本高。但是现在,有一项研究利用卫星图像和机器学习揭示了一种替代方案。该研究小组开发了一个能从卫星图像上识别贫困迹象的机器学习算法,利用上百万张图像精确识别出五个非洲国家的经济状况。

卫星上的高功率相机不断在拍摄地球的照片,而科学家们想知道是否能够只需通过分析这些图像来检测贫困状况。对此的第一次尝试利用的是夜间地球的图像。电灯发出的光描绘了一个地区的基础设施,粗略显示了富人和穷人居住的期房。但是在晚上,中等经济不发达地区与绝对贫困地区之间看不出什么区别。

因此,斯坦福大学的一个由社会科学家和计算机科学家组成的研究小组,在经济学家MarshallBurke的带领下,已经开始利用地球白天的图像进行研究。然而,这些图像也没有显示出中等平困地区和绝对平困地区之间有什么差异。二者都会有泥泞的土路,蜿蜒穿过成群的矮小房屋。但是,白天的图像能显示出:最近的水源的距离有多远?最近的城市市场有多远?哪里有田地?

要从这些微妙的线索中得出结论,一位训练有素的人类专家是做不到的,但是计算机可以做到。理解包含许多变量的大数据集是机器学习领域的一个经典难题。该策略是这样的:首先,获取一个数据集,其中目标变量(在该研究中为人均收入)已知;然后,用这些数据的一个子集来训练计算机,创建一个能在余下数据中准确预测隐藏变量的统计模型。

该研究小组使用一种叫做卷积神经网络的机器学习技术。他们主要研究五个非洲国家:尼日利亚,坦桑尼亚,乌干达,马拉维和卢旺达。这些国家有很大一部分人口生活在绝对贫困之中,而且有良好的实况调查数据可以验证计算机做出的预测。

该研究小组使用公开的数据,包括来自谷歌的白天卫星照片,来自国家海洋和大气管理局的夜间卫星照片,以及来自世界银行的调查数据。他们不需要教算法在白天图像中寻找一个或两个白天贫困的特征,该机器学习算法能通过比较白天照片和夜间照片来确定贫困的特征。

该研究小组的报告于本周四发布在Science上,报告显示,白天的卫星图像比夜间图像更能准确描绘出非洲的贫困情况。白天图像在预测低于绝对贫困线的地区上,准确率为81%;在预测低于绝对贫困线一半的地区上,准确率为99%。

在哥伦比亚大学的地球研究所工作的政治科学家Marc Levy(他没有参与这项研究)说,完成和验证这个工具将仍然需要地面调查。“但这项研究表明,卫星图像加上实地调查要比单独使用其中一个强大得多,”他说,“尤其是在很难或者不可能开展实地调查的地区。”他表示,要将这项技术用于世界其余地区还需要做更多的工作。“这五个国家彼此之间都很像,但是整体上却和世界其他地区有很大的不同。”他举例说,非洲是城市化的历史趋势最后的“抵抗”地区,其中大部分人仍然生活在农村地区。“虽然这项技术确实可行,但将其用在很大程度已经城市化的国家会更加困难。”

该小组得出的结果令人鼓舞,但在该算法实际应用之前,还有很多工作需要做。接下来,研究小组将尝试利用不同分辨率的图像——低分辨率的图像可以识别较大的结构,而高分辨率图像能看清细节,比如屋顶——以提取更多的信息。他们还将利用过去的图像来预测这些地区的未来经济情况。这些都只是这项机器学习算法可能带来的部分效益。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档