案例分享：机器学习如何可以作用在信息安全方面？

原创

人工智能的秘密

发布于 2017-12-20 17:05:01

1.7K0

发布于 2017-12-20 17:05:01

在了解机器学习如何作用在信息安全方面之前，我们要先了解什么是机器学习？通俗得说，机器学习就是“(计算机)无需显式编程即可学习的能力”。跨海量数据集应用数学技术，机器学习算法可建立起行为模型，并基于新输入的数据，用这些模型做出对未来的预测。例如，视频网站根据用户的历史观看记录推出新剧集，自动驾驶汽车从擦肩而过的行人学习路况都是机器学习的例子。那么，信息安全中的机器学习应用又是什么呢?

大体上，机器学习可帮助公司企业更好地分析威胁，响应攻击及安全事件。还有助于自动化更琐碎更低级的工作，也就是之前工作量巨大或技术欠缺的安全团队所做的那些。

安全方面，机器学习是个快速发展的趋势。ABI Research 的分析师估测，在网络安全界，机器学习将推动大数据、人工智能(AI)及分析的投资，有望在2021年达到960亿美元，同时，世界科技巨头已经在采取措施更好地保护自己的客户。

谷歌用机器学习来分析安卓移动终端上的威胁——从被感染手机上识别并清除恶意软件。云基础设施巨头亚马逊收购了初创公司 harvest.AI，并发布了Macie——用机器学习来发现、梳理并分类S3云存储上数据的一项服务。

与此同时，企业安全供应商一直努力将机器学习集成进新旧产品线中，希望能改善恶意软检测率。大多数主流安全公司已从纯“基于特征码”的系统，转向了试图解释行为及事件，并从各种源学习判断安全与风险的机器学习系统。这仍是个新兴领域，但明显是未来发展方向。

AI和机器学习将极大改变安全运作方式，虽然目前正处在驱动网络防御的早期阶段，但已经在终端、网络、欺诈或SIEM中，起到了识别恶意活动模式的明显作用。未来，在防御服务中断、属性及用户行为修改等领域，我们将看到越来越多的用例。

机器学习在安全领域的顶级用例有哪些呢?我们不妨来看看以下5个。

1. 用机器学习检测恶意活动并阻止攻击

机器学习算法可帮助公司企业更快速检测恶意活动，并在攻击开始前就予以阻止。英国初创公司Darktrace于2013年成立，其基于机器学习的企业免疫解决方案( Enterprise Immune Solution )，在这方面已取得了很多成功。作为这家公司的技术总监，大卫·帕尔玛见证了机器学习对恶意活动及攻击的影响。

帕尔玛称，利用机器学习算法，Darktrace最近帮助北美一家赌场检测出了数据泄露攻击。该攻击将联网鱼缸用作了进入赌场网络的切入点。该公司还宣称，去年夏天的WannaCry勒索软件大肆虐中，其算法也防止了类似的一起攻击。

针对感染了150个国家20多万受害者的WannaCry勒索软件，帕尔玛称：“在数秒内，我们的算法就检测出了一家国民医疗服务(NHS)机构网络中的攻击，在尚未对该机构造成任何破坏前，此威胁就被缓解掉了。事实上，我们的客户没有任何一家受到WannaCry攻击的伤害，包括那些没打补丁的。”

2. 用机器学习分析移动终端

移动设备上，机器学习已成主流;但到目前为止，绝大部分活动集中在驱动基于语音的体验上，比如 Google Now、苹果的Siri和亚马逊的Alexa。不过，机器学习在安全方面确实有应用。如上文提及的，谷歌采用机器学习来分析移动终端威胁，而企业则在防护自带及自选移动设备上看到了机会。

10月，MobileIron和Zimperium宣布合作，帮助企业将机器学习集成进移动杀软解决方案中。MobileIron将在自己的安全及合规引擎中，集成Zimperium基于机器学习的威胁检测，并作为联合解决方案售出，解决设备、网络及应用威胁检测，快速自动化动作防护公司数据之类的难题。

其他供应商也在计划改善自己的移动解决方案。LookOut、被赛门铁克收购的Skycure，还有Wandera，是移动威胁检测及防御市场中的佼佼者，每家都用自有机器学习算法检测潜在威胁。拿Wandera举个例子。这家公司最近刚公开发布了其威胁检测引擎 MI:RIAM，据称检测出了超过400种针对企业移动设备的SLocker勒索软件变种。

3. 用机器学习增强人类分析

机器学习在安全领域的核心应用，有人认为是帮助人类分析师处理安全方面的各项工作，包括恶意攻击检测、网络分析、终端防护及漏洞评估。但在威胁情报方面，才是最令人兴奋的。

比如说，2016年，麻省理工学院计算机科学和人工智能实验室(CSAIL)，开发出了名AI2的系统。这是一个自适应机器学习安全平台，可帮助分析师从海量数据中找出真正有用的东西。该系统每天审查数百万登录，过滤数据，并将滤出内容传给人类分析师，可将警报数量大幅降低至每天100个左右。由CSAIL和初创公司PatternEx共同进行的实验表明，攻击检测率被提升到了85%，而误报率降低至原先的1/5。

4. 用机器学习自动化重复性安全工作

机器学习的真正价值，在于可以自动化重复性劳动，让员工可以专注在更重要的工作上。帕尔玛称，机器学习最终应旨在“消除重复性低价值决策活动对人力的需求”上，比如归类威胁情报等活动。让机器处理重复性工作和阻止勒索软件之类战术性救火工作，这样人类就能解放双手去搞定战略性问题了，比如现代化 Windows XP 系统等等。

博思艾伦咨询公司也在走这个路线。据报道，该公司用AI工具更高效地分配人类安全资源，分类威胁，让员工可以专注最关键的攻击。

5. 用机器学习堵上零日漏洞

有人认为，机器学习有助堵上漏洞，尤其是零日威胁和主要针对不安全IoT设备的那些威胁。该领域里已出现了先驱者：《福布斯》报道，亚利桑那州立大学的一支团队，采用机器学习监视暗网流量，以识别与零日漏洞利用相关的数据。有了此类洞见的加持，公司企业就可堵上漏洞，在漏洞造成数据泄露前就断掉漏洞利用的机会。

炒作和误解

然而，机器学习并非万灵丹，至少对一个仍在对这些技术进行概念验证实验的行业来说不是。前路艰难，困难与隐患从来不少。机器学习系统有时候会有误报(无监督学习系统的算法会基于数据推测类型)，而有分析师也坦率承认，用在安全领域的机器学习可能是“黑箱”解决方案——CISO不能完全确定其内部机制。他们只能将自己的信任与责任放到供应商及机器身上。

在某些安全解决方案可能压根儿没用机器学习，盲目的信任可不是什么好主意。

市面上炒作的机器学习产品，大多数都不会在客户环境中真正学习。它们不过是在供应商自己的云上，用恶意软件样本训练出模型，再下载到客户公司，就跟病毒特征码似的。对客户安全来说，这可不是什么进步，基本上是在倒退。

而且，算法投入实际使用前学习模型所需的训练数据样本，也有糟糕数据和实现会产出更糟糕结果的问题。机器学习的效果，取决于你输入的信息。垃圾进，垃圾出。所以，如果你的机器学习算法设计不佳，结果也就不会太有用。算法在实验室训练数据上有用是一回事，但最大的挑战，还在于让机器学习网络防御在现实复杂网络中起效。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

机器学习