AVAR 2017 之感悟

12 月 6 日 ,以“不忘初心——对抗日益严重的网络犯罪”为主题的第二十届亚洲反病毒大会 (AVAR 2017) 在京召开,来自全球 20 多个国家和地区的 200 多位顶级专家学者汇聚一堂,共议反病毒前沿技术及发展趋势。

依我的看法,反病毒的工作以后会越来越依赖三样东西:互联网、大数据和人工智能。病毒和反病毒本身就是一正一反的两个面,大家也在不断地借鉴对方的新技术、新趋势、新的发展方向,魔高一尺道高一丈的情况会继续演绎下去,只是看哪一边走的更快一些,在短期内获得更大的主动权。

会议中,腾讯的马斌发表名为《开放、共享、共建 数字经济时代的网络安全》主题演讲。他指出,伴随着互联网与现实世界的不断融合,人工智能技术的应用拓宽,网络安全领域的研究要实现思维升级,网络安全人才的培养要实现知识升级,网络安全概念的普及要实现认知进化,由此才能从容应对数字经济下的网络安全展趋势。

瑞星安全研究院院长叶超则表示,瑞星一直以来都致力于 AI 技术的研究与落地,早在2012年瑞星就开始探索机器学习在反病毒中的应用,基于指令流的 Malware-Crypter 识别、PDF Exploits 识别,同年,瑞星又尝试了基于决策树的恶意软件识别方案。

2016 年,瑞星根据之前应用机器学习获得的经验,研发了高维度、大规模的基于随机森林的 Windows 恶意软件识别引擎 - RDM+。高维度特征提取自文件结构、内容以及分析,训练样本达数千万。

坊间常说,“数据和特征决定了机器学习的上限。模型和算法只是逼近这个上限而已”。瑞星在研发RDM+时,主要的工作放在了特征工程上,设定了 4778 维的特征向量,这些特征来自文件基本指标、编译器分析、异常节表分析、PE 结构各指标、关键数据熵、指令流及指令流分析以及代码数据分析。

上次老庄参加 AVAR 会议还是在 2007 年,在韩国首都首尔认识了包括金山、江民、安博士、K7、ESet等一大群反病毒行业的同行,当时大家谈论的焦点还在于如何识别变形病毒,如何实现快速的家族病毒处理,如何运用虚拟机来分辨病毒。当年的ESet的模式匹配算法给我印象深刻。

今年的 AVAR 会议上,可以看到大家的研究都在向大数据分析,人工智能、深度学习等方向延伸。无论是有互联网基因的腾讯还是老牌的反病毒厂商瑞星,在这些领域上都进行了深入的研究并开始和自身业务结合。

谈到大数据,就不能不介绍一位好友:赵国栋(中关村大数据产业联盟秘书长、北京大数据研究院副院长)。早在2014年,我们两家一起去海南度假时,一整晚的闲聊,让我获益匪浅,真正认识到大数据的魅力和力量,也对老赵渊博的知识,清晰的思路、卓越的理念及敏锐的直觉钦佩不已。

在此之前,自己觉得对大数据也还算是有些了解,对大数据的认识限于:对很多很多的数据进行标准化、清洗后,根据业务进行分析,得出一些潜在或者隐含的结论。

被老赵扫盲后,突然发现原来搭建一个大数据分析平台其实并不难,难就难在如何和现有的业务相结合,获得现有业务无法获取或很难获取到结论。收集到的大数据,不仅需要进行简单的数据分析,更需要懂得业务相关专业知识的人员,建立在专业知识基础上的分析模型。这就需要一批既了解大数据理念,又熟悉自身行业的专业知识人员。现在市面上绝大多数的“大数据”公司,都是通过 Hadoop 、MapReduse、Spark 等工具来搭建个大数据平台,然后利用别人的数据来生成一些“有用”的结论,轻易赚个盆满钵满,和真正的要求相差较远,这也是近几年来,大家对“大数据”诟病的一点。私下认为:大数据中最值钱的就是【大数据】,其次是【模型】,中间的联系就是最重要的【专业知识】。

在我看来,人工智能无法脱离深度学习,深度学习无法脱离分析模型,而分析模型的建立还是脱离不开大数据的支持,至少短期内是不会发生太大变化的(不知道短期内,Google会不会弄出个创造人工智能的人工智能)。

反病毒行业应把人工病毒处理的方法和经验整理出来,把大量的病毒样本和判断方法导入大数据,通过大数据来分析活跃病毒的行为特征、文件特征、网络特征,获得病毒识别的新方法、新模型。利用新的识别方法和现有的分析方法进行比对,不断调整模型,进行深度学习。

另外一个方向应该是充分利用互联网,监听互联网上的网络传输特征包,通过大数据分析出病毒网络数据特点的时候,自动获取样本,加入数据分析及病毒判断处理。一旦能够确认是病毒的情况,可以自动进行病毒库的更新,快速抵御病毒的侵袭。

从今年AVAR会议的报告内容上来看,无论是大数据还是人工智能分析,都对反病毒技术产生了促进作用。我们期盼着,也许真的有一天,能够像瑞星的叶超介绍的那样:反病毒工程师能够脱离繁重的体力劳动,能够真正做到比病毒快那么一点点。相信最终总有一天,通过大数据的识别方法能够超越现有分析的数据和准确率,让我们能够真正享用安全的计算机环境。

关注信息安全,关注老庄(^_^ )

本文来自企鹅号 - 梦蝶老庄媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

有些决策不能,也永远不该委托给机器

1434
来自专栏PPV课数据科学社区

生育儿童智力水平是否与父母生育时年龄具有统计学关系?

父母年龄与孩子是否优秀,其实要讨论两个阶段,第一个阶段是怀胎十月。关于这方面,前面许多的答案已经说得很完整了,包括怀孕难度增大,流产率增高,唐氏综合症的概率上升...

2746
来自专栏新智元

人类医生的终结者:深度学习医疗2016-17两次大突破

【新智元导读】南澳大学医学专家 Luke Oakden-Rayner 发表了一系列博客文章,讨论机器会不会在短时间内取代人类医生,他总结出了医疗AI领域的 6 ...

3614
来自专栏量子位

机器废渣!AI离占领华尔街还早着呢

吴唯 编译自 WSJ 量子位出品 | 公众号 QbitAI 再怎么炒,把AI用到投资上问题依然很大。 十年前,在自动投资算法突然失控,导致数十亿美金损失和高盛旗...

3348
来自专栏机器人网

向机器人求个职 ,抢走人类的工作还发放岗位了?

奥康纳:机器人并不只抢走人类的工作,它们也开始招聘人类员工了,因为它们可以快速筛选应聘者,但这很危险。 机器人并不只抢走人类的工作,它们也开始向人类发放工作岗位...

2514
来自专栏AI科技评论

业界 | 解读欧盟 GDPR,这将是企业级数据科学不容忽视的合规风险

欧盟于 2018 年 5 于 25 日出台数据保护条例 GDPR,随之在数据科学领域引起了广泛的讨论,这是因为严格的数据条例,将对数据科学项目,尤其是机器学习领...

713
来自专栏AI科技评论

动态 | Nature机器学习子刊封闭式访问遭Jeff Dean等大牛联合抵制

AI 科技评论按:还记得之前韩国将 AI 应用于军事用途吗遭各国大牛联合抵制吗?近期又有人搞事情遭到这帮牛人的联合抵制,其实更准确来说搞事情的是刊物。

1002
来自专栏PPV课数据科学社区

大数据,小数据,哪道才是你的菜?

源自|CSDN 作者|张玉宏 美国著名科技历史学家梅尔文•克兰兹伯格(Melvin Kranzberg),曾提出过大名鼎鼎的科技六定律,其中第三条定律是这样的[...

3364
来自专栏机器之心

Science Robotics | MIT提出机器人建筑平台:只需阳光和原材料即可按需生产房屋

选自:IEEE Spectrum 作者:Evan Ackerman 参与:微胖 MIT 媒体实验室的研究人员在最新一期《科学·机器人》上发表的论文指出,传统建造...

3406
来自专栏CSDN技术头条

深度长文丨大数据,小数据,哪道才是你的菜?

美国著名科技历史学家梅尔文•克兰兹伯格(Melvin Kranzberg),曾提出过大名鼎鼎的科技六定律,其中第三条定律是这样的[1]:“技术是总是配“套”而来...

39810

扫码关注云+社区