警惕AI军事间谍!找出导弹基地人类用2.5天,AI只要42分钟

安妮 千平 编译整理 量子位 出品 | 公众号 QbitAI

就在我们的头顶之上,各种卫星(包括间谍卫星)像狗仔队一样,每天都围着地球疯狂拍下数十TB的照片。这个数量可以说是泛滥了。

每个情报机构都有一批训练有素的分析师,负责搜寻隐藏在海量卫星图像中未申报的核设施或秘密军事基地。

但面对如此海量的数据,据说美国的情报机构已经被错失恐惧症(FOMO)所笼罩。因为人类分析员能处理的图像数量有限,很可能错失真正重要的关键信息。

于是,AI来了。而且来得很恐怖。

前不久,美国研究人员训练出一个深度学习算法,用以识别“东亚某国”地空导弹基地。

这些算法比人类的速度快几百倍,高效找出分布在一块近9万平方公里区域内的地空导弹发射场。这种人工神经网络基于能够过滤和学习大量数据的人工神经元层,达到人类图像分析专家90%的准确率。

令人震惊的是,这种方法还将发现潜在导弹基地的时间从60小时(2.5天)减少到42分钟。

可怕之处在于,这只是公开的“民间”研究。

“用算法发现潜在的导弹基地位置,据我所知,这为人类节省了很多时间” 密苏里大学电气工程和计算机科学教授Curt Davis谈了谈他们的研究方向。

这个研究发表在10月的《应用遥感》杂志上,展示了一种用于大量卫星图像分析的深度学习模型,能够识别情报机构和国家安全专家可能感兴趣的目标。

美国爱国者地空导弹系统运输起竖发射车(TEL)

挑战

在卫星图像分析中应用深度学习AI的挑战通常很难解决。

与人脸、地点或者物体识别相比,卫星图像对深度学习算法提出了更大的挑战。因为卫星图像会从多个角度进行拍摄,同一地点的建筑物可能在照片上是颠倒的,另外同一地点的不同时间里云层的变化也很不一样。

另一个主要问题是相对缺乏大型训练数据集,包括用于训练深度学习算法的手工标记的示例,需要用它来准确识别卫星图像的特征。

对此,Davis团队将全球约2200个地点的公共数据与影响解决方案商DigitalGlobe卫星图像结合在一起,创建自己的训练数据,然后通过测试四种深度学习模型找到最佳测试数据。

但研究人员手中确认的地空导弹基地图片只有90个。这样一个小型训练数据集通常无法产生准确结果。为了解决这个问题,Davis等人将原始图像稍微改变了方向,把90多个训练样本转换成大约893000个训练样本。

这项研究中的成绩很可能得益于导弹发射基地占地很大,在卫星图像上看也有独特的图案。

两类常见的原型/对称地空导弹发射场

挑战接踵而至。

卫星图像之间的分辨率也差异很大。这让问题进一步变得复杂,想要深度学习算法效果最好,通常需要给定相同大小的图片。另外,除了可见光图像之外,不少卫星拍摄的还是红外或者其他光谱波段的图像。

在试图分析诸如移动导弹发射装置、雷达天线、移动雷达系统和军用车辆等较小的物体时,深度学习算法面临着一个更大的挑战,因为可用的卫星图像数据在提取识别特征时像素会减少。

“在我们的大脑中,CNN如何处理这样的小尺寸物体是一个悬而未决的问题,尤其是在大型数据集的测试中,就像我们在这次研究中所做的那样。”Davis说。

未来

种种的不完善,让深度学习面临巨大障碍。即使算法能够达到80%或90%的精度,专家仍然认为AI不具备接管整个工作的能力。

今年7月以来,各路高手纷纷开始在全球最大的卫星图像公开数据集上训练机器学习算法。这个数据集包含100万个带标签的对象,包括不同的建筑和设施。

这个数据集的提供者,是美国情报高级研究计划局(IARPA)。他们赞助举办的这次大赛,就是想找到一个更好的AI解决方案,分担人类分析员75%的工作。

(量子位插播,大赛地址在此:https://www.iarpa.gov/challenges/fmow.html)

共有10个团队进入到这次挑战的决赛阶段,整个比赛要下个月结束。

IARPA的项目经理Hakjae Kim说:“美国情报机构的手里已经有了一些方案,但速度和方法总是有提升的余地”。

“现在的技术状态,只有人与机器合作才能真正找到答案”,笛卡尔实验室CTO麦克·沃伦(Mike Warren)说。笛卡尔实验室已经把深度学习用于分析商业卫星图像,对美国玉米和大豆的收成进行预测。

即使不完美的AI工具也会有助于情报收集工作。

例如,国际原子能组织(IAEA)的任务是监测所有已申报的核设施,并在近200个国家中寻找未申报的设施。

加州的米德尔伯里国际研究所研究员Melissa Hanham表示,深度学习工具可以帮助IAEA和其他独立组织利用卫星图像监测发展核势力和大规模杀伤性武器的发展。

“我们就处于这样一个世界,”Hanham说,“我期待自动化将工作中乏味而多余的部分取代。”

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-11-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

黑箱难题仍在阻碍深度学习的普及

? “机器学习基本就是线性数学,很好解释,”数据公司Teradata首席技术官斯蒂芬·布罗布斯特(Stephen Brobst)在Teradata合作伙伴大...

39640
来自专栏量子位

更快更高更强大,这是英特尔AI助力长城修缮的新进展

通过英特尔人工智能技术、深度学习技术、无人机技术等,如何实现对于箭扣长城的保护与修缮? 答案就在视频里。

10400
来自专栏机器之心

业界 | 无人机+深度学习,英特尔AI技术高效助力文物保护

通过英特尔人工智能技术、深度学习技术、无人机技术等,如果实现对于箭扣长城的保护与修缮?答案就在视频里。

11800
来自专栏机器之心

现场 | CVPR 2018第一天:精彩的Workshop与被中国团队进击的挑战赛

前伯克利 CS 系主任 Jitendra Malik:研究 SLAM 需要结合几何和语义

7810
来自专栏专知

【中国计算机大会2017】丘成桐,沈向洋,李飞飞精彩演讲内容荟萃

丘成桐演讲全文:工程上取得很大发展,但理论基础仍非常薄弱,人工智能需要一个可被证明的理论作为基础 今天很荣幸地收到你们的邀请来做一个演讲。我本人在数学上的贡献不...

37670
来自专栏大数据文摘

微软研究院芮勇谈计算视觉:从感知到认知的长征

16710
来自专栏新智元

【重磅】Nature子刊 | 增强学习强化,混合脑生化鼠“走迷宫”能力大幅提升

【新智元导读】浙江大学吴朝晖课题组的研究人员日前在 Scientific Reports 发表论文,描述了一种结合了小鼠和增强学习算法计算机的混合脑机系统,结果...

36980
来自专栏数据派THU

清华大学张长水教授:机器学习和图像识别(附视频、PPT下载)

本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲...

50330
来自专栏机器之心

ICML 2018 | 腾讯张潼中8篇论文,清华排名国内居首:大会论文接收情况一览

第 35 届机器学习技术国际会议(ICML)于 7 月 10 日在瑞典首都斯德哥尔摩举行。ICML 是 AI 领域最负盛名的学术会议之一,也是很多研究人员发表研...

13120
来自专栏新智元

【震撼】这些专业级摄影作品竟然出自谷歌神经网络之手!

【新智元导读】谷歌研究人员提出利用机器学习学习“主观”概念的新方法,模仿专业摄影师的工作流程,遍览谷歌街景地图并搜索最佳作品,然后进行各种后续的处理,创造出媲美...

34180

扫码关注云+社区

领取腾讯云代金券