@三斗室 饶琛琳“大话”运维安全

运维安全是企业安全保障的基石,不同于Web安全、移动安全或者业务安全,运维安全环节出现问题往往会比较严重。就此,《安全智库》记者采访了《日志易》产品总监饶琛琳,让我们跟随记者,一起来听听。

		

记者:SaaS服务和传统软件产品或云服务在安全方面有哪些差异?

饶: 主要体现在几个方面,一个方面就是传统软件本身的安全性,也就是本身已经在一个内网之中,更多的考虑的就是,对方会不会进入到我们的内网来,或者说进到内网以后,怎么来保障像SQL注入等这种软件架构上的事情。而SaaS或者云服务,要把很多的精力放在传统的内网服务,而不会去考虑用户基本就是我们内部的人。

但是SaaS或者云服务是不一样的,比如前段时间出的这样一个事情,就是有人问说阿里云上怎么不同的客户互相之间,二层的网络之间居然不是隔离呢?阿里云说其实我们本来是应该做隔离的,但是由于不方便,就把默认选项改了。这其实就是云服务很需要去关注的。云平台之上的隔离,当身处内网之中,是不需要去考虑太多的,但是在做云服务或者SaaS服务的时候,不同的租户之间的隔离是非常重要的。

记者:在云环境下,运维工作有哪些挑战?您是如何应对的?

饶:云环境下,我觉得运维的挑战跟之前比,有一些可能不太统一的地方,主要在于,以前传统的地方从底层的机架、服务器都会有人在管,但是在云环境下,更多的是需要调用API,比如说调用API创建了一台主机,调用API去生成了一个服务,可能给运维人员的一个感觉就是,我们的重要性是不是在下降?当初我们做的很多活现在就被机器代替了!这其实是一个从表面上看起来很有挑战性的事情,这就是促进运维人员应该去面对的一个现实,就是我们运维真正的目的,不是管好服务器就OK,这其实不应该叫运维工程师,而是应该叫机房管理员。

运维工程师真正该做的事情是怎么去提高好运维的站点。运维站点可能是网站的站点,普通网站,也可能现在纯粹的APP后面没有太多的Web,只是一些接口,运维的站点,服务好客户,而服务好的话,除了保证稳定性、提高性能等,我们应该抓住一些实质,其实调不调API没有关系,而是我知道服务好不好,有没有办法让它更好。调API去新创建几台主机,这个很简单,不管是运维人员还是开发人员做的,这个都OK,但是什么时候该调这个API去创建主机?这台主机我创建的是有价值的。这个时间点的把握,怎么把这个事情运用在最恰当的时候,这是在云环境下运维工程师们应该重点去考虑的一个方向,以后应该是往这条路上去走的。

记者:谈谈现在火热的人工智能(AI),运维会不会逐步被机器学习取代?

饶:我刚刚前面其实讲云的时候其实已经提到了一点,运维有一些工作是迟早要被机器去代替的,但是另外一部分,可能是不太一样的地方,除了一些标准的部署上架的工作之外,剩下的一部分工作,刚刚我们提到保证服务的可用性和提高服务的性能,这里保证可用性就涉及到一个很大的问题就是故障定位,出了一个问题怎么找到它,它的根源在哪儿?

这块目前我看到的情况,我们可以通过一些机器学习的算法,比如说监控了有10000个机器指标,大概可能有二三十个跟报警的那个差不多,那下一步人就要去操作了,因为这是机器学习很重要的一点,就是机器学习是不讲因果性,只讲相关性,所以我们经常看到有人在讲人工智能的时候有一些笑话,今天下雨了,明天怎么样,这个其实是相关的,从这个曲线上来看,发生了A了也发生了B,它其实是相关性,并不是因为A所以B,这一点在目前的运维工作上也是类似的道理,这个时候是需要运维人员通过经验来弥补后来的这一段的。

记者: 近几年,运维领域有什么重要进展?

饶:运维领域这些年的进展主要两个方面。一个方面的是在容器编排这块,就是所谓的Docker,这几年确实发展的很快,尤其包括在Docker之上,K8S,DCOS等,它是大大方便了运维部署,降低了部署成本,所以这也是运维以后部署这件事情,可能以后运维真的就不用做了。以前在虚拟化时代,其实因为虚拟化本身部署也挺辛苦的,但是现在Docker确实把成本降得很低。

另一个方面就是我们日志易在做的事情 ,怎么更快的提高数据 对服务的可用性以及性能提高的这一部分,就是降低MTTR,或者降低MTTI,这一部分原先其实也是很靠经验的。你可能工作了15年了,看见这个事情有经验了,可能就会去猜,觉得是这个样子,然后我们就去查,但是现在有一套数据分析的平台在支撑,之后这种大概、可能、猜测尝试的时间就会被大大的缩短,故障的时间就会随之降低下来。因为运维本质其实是一个试错的工作,你有100个思路,赶紧去试第一个,不对,赶紧放弃去试第二个,如果原先靠人的话,试100个大概就需要1个小时,是现在有这样一个统一的平台,你可能试100个,可能也就需要5分钟或者10分钟,那问题就一定被解决了。

记者:对于一些中小客户,在安全零基础的情况下,您对安全建设有哪些建议?资源短缺、人力极少的情况下做好安全运维您有哪些高招?

饶:如果安全0基础的话,就是卡好最容易被攻破的地方,比如简单密码或者一些基础的端口,不要成为最短板。

如果资源短缺、人力也少的话,安全事大,我们有必要来投入钱或者资源,去采购一些,至少能够保证最关键的东西,核心数据确实是需要去投入的,不管投入的是什么,有资源投资源,有人投人,如果都没有,那就投点钱吧~~

本文采访内容仅代表嘉宾观点,不代表《安全智库》观点。

原文链接:

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算D1net

当大数据分析与云技术双剑合璧

大数据的出现使业务智能真正地走入了21世纪。但事实上“大数据”词代表的并不是解决方案,而是一类问题。在这些PB数量级的数据中,隐藏着怎样的价值?我们从中能...

29070
来自专栏ThoughtWorks

TW洞见 |建设DevOps能力到底有多重要?典型问题+对症方法

当软件行业进入互联网时代,市场对软件产品和服务的交付提出了更高的要求:不仅要快速实现需求,而且要快速发布上线,并且必须保证业务可靠、高效运行。为了满足这些要求...

34570
来自专栏DevOps时代的专栏

DevOps 标准体系发布及权威解读

一、DevOps 标准体系 ? 2017年11月17日,云计算开源产业联盟第一次跟高效运维社区一起在上海合办了首届金牌运维峰会,在工信部软件司的指导下,由中国信...

40860
来自专栏nice_每一天

《互联网架构 》来自一位大牛的分享

对于大部分程序员来说架构师这条路还很远。但是掌握现阶段Java的主流技术无疑提升了自身的竞争力。

16110
来自专栏领域驱动设计DDD实战进阶

领域驱动设计-软件挑战与应对

31880
来自专栏大数据文摘

中国移动社群生态报告(下载39PPT)

287110
来自专栏钱塘大数据

《2017微信数据报告》发布,这数据很“大”!

作者:腾讯 11月9日消息 今天腾讯官方发布了最新的《2017微信数据报告》,根据腾讯公布的数据,微信在国内已经成为首屈一指的聊天软件。报告核心数据如下: 1...

74590
来自专栏华章科技

腾讯发布2017年代码报告

腾讯发布2017年代码报告,对过去一年研发数据进行了统计,涵盖代码、开发者、语言等基础数据。

10350
来自专栏PPV课数据科学社区

【资讯】甲骨文融合中间件即服务满足企业云需求

甲骨文公司亚太及日本区融合中间件管理高级总监李国东 像所有新概念一样,“大数据”经历过一段炒作期后,已经被企业所普遍接受。IDC的报告显示:全球...

29760
来自专栏WeTest质量开放平台团队的专栏

用上WeTest适配测试,流失用户减少一半!

为什么需要适配测试? 近期,腾讯游戏工作室对近2000名流失玩家进行了一次问卷调查活动。

12920

扫码关注云+社区

领取腾讯云代金券