以下是一些phish-AI研究:利用机器学习自动检测的网络钓鱼URL

人工智能系统已经被证明为钓鱼网站生成URL,它似乎可以躲避安全工具的检测。

本质上,软件可以提供网页的URL,伪装成真实网站的合法登录页面,实际上,网页只是收集输入的用户名和密码,以便劫持帐户。

黑名单和算法 - 智能或其他 - 可用于自动识别和阻止钓鱼网页的链接。人们应该能够发现是钓鱼网络链接的,但并不是每个人都能发现。

利用Phishtank数据库,美国佛罗里达州一家网络安全企业Cyxtera Technologies的一群计算机科学家已经构建了DeepPhish,这是一种机器学习软件,据称,该软件会生成仿冒这些防御机制的钓鱼网址。

“通过智能算法,智能检测系统能够以98.7%的准确度识别模式并检测钓鱼网址,为防守团队提供战斗优势,”Cyxtera的Alejandro Bahnsen 本月早些时候声称

“但是,如果人工智能被用来防止攻击,那么是什么阻止网络犯罪分子利用相同的技术来击败传统和基于人工智能的网络防御系统呢?”

训练

该团队检查了Phishtank上的超过一百万个网址,以找出三个不同的网络钓鱼歹徒,他们生成了网页来窃取人们的证书。该团队将这些网址提供给基于人工智能的网络钓鱼检测算法,以测量这些网址绕过系统的有效性。

三人组中的第一个丑闻使用了1,007个攻击URL,并且在106个域名中只有7个有效地避免了触发警报,因此只有0.69%的时间成功。第二个在19个域中有102个恶意网址。其中只有五个绕过了威胁检测算法,并且有效率为4.91%。

接下来,他们将这些信息提供给长短期记忆网络(LSTM),以了解恶意URL的一般结构并提取功能 - 例如,在其地址中常用的第二个威胁演员。

所有来自有效网址的文本都被用来创建句子并编码成一个矢量,并输入到LSTM中,在那里它被训练以预测前一个字符的下一个字符。

随着时间的推移,它会学习生成一个文本流,以模拟与用作输入的虚拟URL类似的伪URL列表。当DeepPhish接受第一个威胁演员的数据培训后,它还设法创建了1,007个URL,其中210个有效逃避检测,将分数从0.69%提高到20.90%。

当它跟随第二个威胁主体的结构时,它也产生了102个假冒URL,其中37个成功,从而增加了将现有防御机制从4.91%降到36.28%的可能性。

有效率不是很高,因为很多LSTM是有效的乱码,包含禁止字符的字符串。

研究人员警告说:“通过整合每个威胁演员可能创建的新的合成URL,自动执行人工智能仿冒检测系统的再培训过程非常重要。®

Hat给前Reg书记杰克克拉克,他在他的每周人工智能通讯的最新版中突出了该项目。

  • 发表于:
  • 原文链接http://www.theregister.co.uk/2018/06/19/ai_phishing_generator

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励