@三斗室 饶琛琳“大话”运维安全

运维安全是企业安全保障的基石,不同于Web安全、移动安全或者业务安全,运维安全环节出现问题往往会比较严重。就此,《安全智库》记者采访了《日志易》产品总监饶琛琳,让我们跟随记者,一起来听听。

		

记者:SaaS服务和传统软件产品或云服务在安全方面有哪些差异?

饶: 主要体现在几个方面,一个方面就是传统软件本身的安全性,也就是本身已经在一个内网之中,更多的考虑的就是,对方会不会进入到我们的内网来,或者说进到内网以后,怎么来保障像SQL注入等这种软件架构上的事情。而SaaS或者云服务,要把很多的精力放在传统的内网服务,而不会去考虑用户基本就是我们内部的人。

但是SaaS或者云服务是不一样的,比如前段时间出的这样一个事情,就是有人问说阿里云上怎么不同的客户互相之间,二层的网络之间居然不是隔离呢?阿里云说其实我们本来是应该做隔离的,但是由于不方便,就把默认选项改了。这其实就是云服务很需要去关注的。云平台之上的隔离,当身处内网之中,是不需要去考虑太多的,但是在做云服务或者SaaS服务的时候,不同的租户之间的隔离是非常重要的。

记者:在云环境下,运维工作有哪些挑战?您是如何应对的?

饶:云环境下,我觉得运维的挑战跟之前比,有一些可能不太统一的地方,主要在于,以前传统的地方从底层的机架、服务器都会有人在管,但是在云环境下,更多的是需要调用API,比如说调用API创建了一台主机,调用API去生成了一个服务,可能给运维人员的一个感觉就是,我们的重要性是不是在下降?当初我们做的很多活现在就被机器代替了!这其实是一个从表面上看起来很有挑战性的事情,这就是促进运维人员应该去面对的一个现实,就是我们运维真正的目的,不是管好服务器就OK,这其实不应该叫运维工程师,而是应该叫机房管理员。

运维工程师真正该做的事情是怎么去提高好运维的站点。运维站点可能是网站的站点,普通网站,也可能现在纯粹的APP后面没有太多的Web,只是一些接口,运维的站点,服务好客户,而服务好的话,除了保证稳定性、提高性能等,我们应该抓住一些实质,其实调不调API没有关系,而是我知道服务好不好,有没有办法让它更好。调API去新创建几台主机,这个很简单,不管是运维人员还是开发人员做的,这个都OK,但是什么时候该调这个API去创建主机?这台主机我创建的是有价值的。这个时间点的把握,怎么把这个事情运用在最恰当的时候,这是在云环境下运维工程师们应该重点去考虑的一个方向,以后应该是往这条路上去走的。

记者:谈谈现在火热的人工智能(AI),运维会不会逐步被机器学习取代?

饶:我刚刚前面其实讲云的时候其实已经提到了一点,运维有一些工作是迟早要被机器去代替的,但是另外一部分,可能是不太一样的地方,除了一些标准的部署上架的工作之外,剩下的一部分工作,刚刚我们提到保证服务的可用性和提高服务的性能,这里保证可用性就涉及到一个很大的问题就是故障定位,出了一个问题怎么找到它,它的根源在哪儿?

这块目前我看到的情况,我们可以通过一些机器学习的算法,比如说监控了有10000个机器指标,大概可能有二三十个跟报警的那个差不多,那下一步人就要去操作了,因为这是机器学习很重要的一点,就是机器学习是不讲因果性,只讲相关性,所以我们经常看到有人在讲人工智能的时候有一些笑话,今天下雨了,明天怎么样,这个其实是相关的,从这个曲线上来看,发生了A了也发生了B,它其实是相关性,并不是因为A所以B,这一点在目前的运维工作上也是类似的道理,这个时候是需要运维人员通过经验来弥补后来的这一段的。

记者: 近几年,运维领域有什么重要进展?

饶:运维领域这些年的进展主要两个方面。一个方面的是在容器编排这块,就是所谓的Docker,这几年确实发展的很快,尤其包括在Docker之上,K8S,DCOS等,它是大大方便了运维部署,降低了部署成本,所以这也是运维以后部署这件事情,可能以后运维真的就不用做了。以前在虚拟化时代,其实因为虚拟化本身部署也挺辛苦的,但是现在Docker确实把成本降得很低。

另一个方面就是我们日志易在做的事情 ,怎么更快的提高数据 对服务的可用性以及性能提高的这一部分,就是降低MTTR,或者降低MTTI,这一部分原先其实也是很靠经验的。你可能工作了15年了,看见这个事情有经验了,可能就会去猜,觉得是这个样子,然后我们就去查,但是现在有一套数据分析的平台在支撑,之后这种大概、可能、猜测尝试的时间就会被大大的缩短,故障的时间就会随之降低下来。因为运维本质其实是一个试错的工作,你有100个思路,赶紧去试第一个,不对,赶紧放弃去试第二个,如果原先靠人的话,试100个大概就需要1个小时,是现在有这样一个统一的平台,你可能试100个,可能也就需要5分钟或者10分钟,那问题就一定被解决了。

记者:对于一些中小客户,在安全零基础的情况下,您对安全建设有哪些建议?资源短缺、人力极少的情况下做好安全运维您有哪些高招?

饶:如果安全0基础的话,就是卡好最容易被攻破的地方,比如简单密码或者一些基础的端口,不要成为最短板。

如果资源短缺、人力也少的话,安全事大,我们有必要来投入钱或者资源,去采购一些,至少能够保证最关键的东西,核心数据确实是需要去投入的,不管投入的是什么,有资源投资源,有人投人,如果都没有,那就投点钱吧~~

本文采访内容仅代表嘉宾观点,不代表《安全智库》观点。

原文链接:

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏从流域到海域

可视化微服务:设计微服务系统

原文地址:https://dzone.com/articles/visualizing-microservices-designing-a-microservi...

2367
来自专栏云计算D1net

云计算提供商在2017年需做好应对网络攻击的准备

在对于全球主要安全供应商在2017年可能发生的事件的年度预测中,主要云计算服务提供商将在2017年遭遇更多的网络攻击,其中包括勒索软件可能进入基于云计算的数据中...

2514
来自专栏SDNLAB

2014年SDN大事记

‍编者按:在2014年辞旧迎新之际,回首这一年当中SDN落地的历程。我们会知道SDN的发展趋势是怎样的,各大厂商在这一年中在SDN落地方面又作出了怎样的努力,各...

3184
来自专栏SDNLAB

你需要知道的混合云最佳实践

1693
来自专栏ThoughtWorks

数据安全在交付中的思考 |洞见

2017年7月,Equifax用户数据泄露事件使得1亿4千300万个人信息(包括社会保障号码、出生日期、地址、驾照编号)和20万9千个用户的信用卡数据被盗。该事...

822
来自专栏云计算D1net

管理容器和混合IT:云初创企业更在行

随着容器、开源和混合云逐渐成为主流,对管理这些技术工具的需求量也变得很大。一些新的公司应运而生。 十年前,即使是最狂热的云技术拥护者也无法预料到它如此快速的崛起...

3119
来自专栏FreeBuf

观点 | 虽然Devops 可以提升效率,但也增加了IT攻击面

写在前面的话 DevOps最基本的一个功能,或者说优势,就是它可以将产品的开发团队跟运营团队合并成一个具有凝聚力的“个体”,而这样就可以很大程度地提升工作的效率...

1888
来自专栏云计算D1net

混合云策略的推动因素及优势

还没有做好完全脱离数据中心的准备,但是却对云计算所提供的优势十分感兴趣?很多人都有相同的想法。尽管现在越来越多的企业IT部门逐渐适应了云环境,但是企业还是不能放...

2706
来自专栏云计算D1net

未来桌面虚拟化 将朝向何方发展

未来的桌面虚拟化,将朝向何方发展?有观点认为,DaaS,即Desktop as a service(桌面即服务)是一种可能的路径。 “虚拟化”,作为一个热门的技...

2956
来自专栏腾讯技术工程官方号的专栏

海量服务 | 论服务器极致化海量运营交付的未来

看标题一定会有些歧义, 总觉着是来讨论航运的, 其实是来和大家研讨我厂海量服务器的营运。

7.6K17

扫码关注云+社区