机器学习帮助探测网络漏洞

据麻省理工《技术评论》2016年8月报道,美国亚利桑那州立大学的研究人员发现了一种利用机器学习来研究黑客论坛和暗网络及深网络市场的方法,从而可探测网络漏洞。

2015年2月美国微软公司在其Windows操作系统中发现了一个关键漏洞,可能会让恶意攻击者远程控制目标计算机。这一问题影响了大范围的Windows操作系统,包括Vista、Win7、Win8、以及专为服务器和移动电脑设计的众多系统。微软公司立即发布了补丁,但该漏洞的详细信息不久就传遍了黑客圈。2015年4月,网络安全专家发现基于这种漏洞的攻击程序在暗网络市场出售,卖家要价约1.5万美元。7月,首个利用这一漏洞的恶意软件出现了,这款恶意软件叫做Dyre银行木马(Dyre Banking Trojan),目标是世界各地的用户,专门从被感染的计算机上盗取信用卡号。

这一事件让我们主要了解了恶意软件是如何演变的。短短几个月的时间里,黑客就将一个漏洞变成了一个攻击程序,用于出售,然后任由其发展成向全世界传播的恶意软件。在这个例子中,微软在漏洞还没有被攻击程序利用之前就发现了它,所以能发布一个补丁。但如果恶意软件利用了以前未发现的漏洞,软件最初的所有者就必须立即开发一个补丁,从字面上说就是用时“零天”,因此有个名字叫“零日漏洞攻击”(zero day attack)。

网络安全专家的主要目标是在零日漏洞攻击程序变成恶意软件之前发现它们。对于美国亚利桑那州立大学的埃里克·努内斯(Eric Nunes)及同事们来说,Dyre银行木马为这种类型的网络安全的全新解决方法提供了很重要的启示。现在,他们发现了一种网络威胁情报收集方法,利用机器学习来研究黑客论坛和暗网络及深网络市场,以寻找新出现漏洞的线索。他们的新系统有了令人欣喜的开端,“现在,这个系统平均每周收集了305个高质量的网络威胁警告,”努内斯和同事们说。

首先了解一些背景知识。黑客及其他心怀不轨的人总是用下列两种方法之一来隐藏他们的论坛和市场。第一种依靠广泛使用的Tor软件让其在互联网上的行踪匿名,防止被追踪,这被称为“暗网络”。另一种则是利用在网络开放部分设立的站点,但这种站点不会被搜索引擎检索,这就是“深网络”,同样难以搜寻。

要监控黑客在这些区域的活动,努内斯及其同事开发了一个爬虫程序从深网络和暗网络上的HTML页面收集信息。显然,此项工作的主要部分是让爬虫程序定位到最佳起始页面,该任务必须由熟悉这些页面的人来完成。然后,该团队从中提取关于黑客活动的具体信息,去掉了其他与毒品、武器等相关的信息。最后,他们利用机器学习算法来检测在这些站点讨论的相关产品及话题。他们的做法是手动标记25%的数据,指出哪些是相关的、哪些是无关的。一个人需要一分钟来标记五个市场产品或标记两个论坛话题,但随着机器学习的进展,这一时间可以缩短。然后,他们就利用这些标记的数据集来训练算法,并用剩余的数据来测试它。

得到的结果读起来很有趣。“使用了机器学习模型,我们可以以高准确度找到与恶意黑客攻击相关的92%的市场产品和80%的论坛话题,”努内斯和同事们说。这项技术已经发现了多个恶意行为。该团队表示,“4周时间内,我们从市场数据中检测到了16个零日漏洞攻击程序。”其中包括了一个安卓(Android)的严重攻击程序,售价约2万美元,一个与因特网浏览器(Internet Explorer 11)相关,售价约1万美元。这显然是有利可图的生意。努内斯和同事们说,“这位供应商的平均评分是4.7/5.0,评分来自市场上的顾客,成功交易超过7000次,说明了产品的可靠性和这位供应商的受欢迎程度。”

这在打击网络犯罪上迈出了有用的一步。现在,该系统每周发现超过300起网络威胁,它已经引起了商业界的注意。事实上,这个团队表示现在他们正把这个系统移交给商业合作伙伴。如果他们继续在零日漏洞开发成恶意攻击产品前就发现它们,他们能帮助软件所有者迅速开发补丁,这对安全专家帮助很大。

当然,这个系统将成为网络安全的猫捉老鼠游戏的一部分。有趣的是看到黑客现在如何改变自己的行为,因为他们知道了自己正通过这种方法被系统化监视。如果改变发生了,就会进入新的一轮游戏。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-09-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吴伟祥

Java Calendar 类的时间操作 原

Calendar 的 month 从 0 开始,也就是全年 12 个月由 0 ~ 11 进行表示。

773
来自专栏跟着阿笨一起玩NET

C#巧用Excel模版变成把Table打印出来

转载:http://blog.csdn.net/gwblue/article/details/38865525

1162
来自专栏xingoo, 一个梦想做发明家的程序员

windows程序设计-第四章 system1.c

/*---------------------------------------------------- SYSMETS1.C -- System M...

23510
来自专栏菩提树下的杨过

MSDN官方的ASP.Net异步页面的经典示例代码

示例1.演示异步获取一个网址的内容,处理后显示在OutPut这一Label上 using System; using System.Web; using S...

1985
来自专栏张善友的专栏

Using sqlite with .NET

The other day I found that there is a .NET wrapper for sqlite. sqlite is a very ...

2278
来自专栏码匠的流水账

聊聊EurekaRibbonClientConfiguration

spring-cloud-netflix-eureka-client-2.0.0.RELEASE-sources.jar!/org/springframewor...

1161
来自专栏c#开发者

C# : row-clickable GridView and get and set gridview rows using JavaScript

Complete C# code: ---------------- using System; using System.ComponentModel; ...

2996
来自专栏吴小龙同學

时间工具类TimeUtil

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30...

3036
来自专栏听雨堂

想修改CSS

      下载了一个“通用”的CSS文件,本来想偷懒的,结果发现有问题,就是它用的颜色是变量定义的,无法识别。我又找不到在哪里可以定义。 BODY{     ...

20410
来自专栏互联网开发者交流社区

WinForm之窗体应用程序

1843

扫码关注云+社区