前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hadoop如何通过IT审计(上)?

Hadoop如何通过IT审计(上)?

作者头像
大数据文摘
发布2018-05-21 17:05:40
1.1K0
发布2018-05-21 17:05:40
举报
文章被收录于专栏:大数据文摘大数据文摘

内容:

1. 决策摘要

2. IT和企业风险环境

3. 越来越多的IT规范

4. Hadoop的职能

a. 安全

b. 灾难恢复和业务连续性

c. 资料管理:监督和法律要求

5. 额外要求

6. 关键要点

Hadoop最初并不是为企业环境所创造的,而是针对象Google, Yahoo, Facebook及Twitter等网络数据中心环境而产生的。这些公司拥有无论是架构,支持还是管理都完全不同于企业IT的网络环境。因此,Hadoop缺乏足够的功能以及内部进程来满足企业IT对安全性,可用性,数据整合以及数据管理方面的要求。

毫无疑问,在某些企业级的产业里,比如金融服务,医疗健康,医药和能源,Hadoop已经落地生根并且逐渐枝繁叶茂。绝大多数的应用都在以IT为核心的部门里,从提供和整合IT基础设施(嵌入式存储,网络传动,等等)的角度来参与。除此之外,这些“草根”级的Hadoop项目仍然位于次要地位,并没有被视为关键的产品级的IT服务。

Hadoop必须进一步成熟,才能成为有生命力的能够支持关键商业功能进行实时应用的企业平台。随着Hadoop的成熟,那些正在学习其来龙去脉的公司也同样走向成熟。企业IT将更加直接参与到管理和支持Hadoop中来 – 而这并不是一个轻而易举的过程。本质上,Hadoop必须采取IT集中化的规则,因此这个平台必须支持生产数据中心的安全水平,管理流程,数据保护和数据完整性保障,数据管理政策,尤其重要的是服务级别协议(SLAs)。

该报告有以下内容:

1. 将Hadoop置于企业IT的背景下,并帮助管理Hadoop平台使其能够担负起企业数据管理政策和流程的责任。

2. 利用上面提到过的产业部门和数据来源的信息总结概述相关的政策。

3. 描述如何能使Hadoop对企业IT基础构架,安全,审计以及监督管理负责。

4. 通过处理以上这些问题,Hadoop可以进一步深化至整个生产状况中去,包括对实时应用的支持。

IT和企业风险环境

企业IT通常致力于试图调解两种看上去相互矛盾的力量:减少风险和创造新的商机。前者是“顾后”而后者则是“瞻前”。迄今为止,对IT驱动的一种重要力量是维持已存在应用的可达性,这已经是管理风险的一个要素。即使是短期的瘫痪一个关键的应用都会造成在收入,生产率方面的损失,以及用户群体的不满意。而且对知名度高的公司来说损失尤甚 ---- 公众往往会认为这是一种“断电”。

相对而言,创造新的商机对于IT的驱动力要小很多。这其实很不幸,因为当公司缺乏投资新商机的能力时,收入增长将会很有限。没有新的应用,生意会停滞。然而IT往往忽视这一核心功能。这一现象通过遵守80/20规则的IT预算就可以看出:80%的预算都投入在维护现存设施和应用上。剩下只有20% 投入到按照优先级所列的新项目中。 IT管理员工的时间分配也是相同的规律,大部分都遵从80/20准则。

在一个企业IT预算通常随时间保持不变或缓慢增长的世界里,稍稍向新收入产生的方面多投一些预算往往会收到非常明显的回报。然而,当风险意识处于第一位时,这种调整预算平衡的做法一般都无疾而终。将更多预算引导至平衡表中机会一侧的唯一途径就是降低风险管理和维护IT现状的总成本。

在这里,我们先特别讨论一下将企业IT作为风险要素之一的规章和法律环境。接下来,我们要将对这种环境的理解应用到Hadoop这个正在被用来产生新商机的平台。最后,我们需要澄清的是,为了使Hadoop从试点项目的地位成长为产品应用的主要环境,Hadoop不能增加企业的风险性。如同其他IT产品应用和平台一样,Hadoop必须能够满足企业为了降低风险而设计和实施数据管理政策和流程的要求。不可否认,在人们了解到做不到这点已经导致超过10亿美金的罚款和赔偿金,而且一些经理们遭受牢狱之灾之前,我们所说的一切确实有点让人索然无味。但了解企业Hadoop用户的潜在风险是极其重要的。

规章和IT规则

对于IT管理人和IT审计员,尤其是那些正在试图解决规章遵守的人来说,其中一个挑战就是通常,一条规章是不足以满足IT相关事务,比如安全,记录保存,或者是业务连续性的要求的。根据产业分类,许多规章----有时甚至是相互冲突的----可以应用并导致同样的数据不仅适用于多种规章,而且是来源不同的多种规章的情况。这一点对于某些特定产业的上市公司尤为正确,这些行业同时受限于行业特定要求和证券交易委员会对所有上市交易公司的规章。随着IT逐渐成为行业部门的关键支持功能,与IT安全和持续性以及数据管理和保存有关的事务也日益增加。

在企业IT中评估规章遵从水平的最佳途径之一就是评估那些更为人所知的规章和监管机构。一些专门处理IT相关事务的机构,产业组织和立法行动参考以下列表。

规章必须实现商业风险管理的功能,而这要求额外的IT管理的投入,通常要从其他IT项目中划取预算和人力资源。然而,对不遵守规章者的惩罚对于公司和个人而言都是灾难性的,因此这方面的投资是必要的。

Hadoop需要对哪些负责?

Hadoop必须成熟以成为能够在企业里支持关键性商业应用的平台。这里所论述的成熟意味着具有能够应对IT管理员以及审计员,安全人员,尤其是记录管理员的一般要求。尤其是,Hadoop必须至少能够应付基本的企业级别安全性,灾难恢复,业务连续性以及那些可以广泛应用于实时商业功能的记录管理的要求。

安全性

以多种不同形式所体现的数据安全或许是包含在为规范特定类型数据的采集,整理和储存所实施的广泛的立法和产业行为里最常见的一种。绝大多数的规章都有针对信息安全的要求。对有权使用信息的人员的监管是最基本的要求之一。一般的要求通常包括:

1. 只允许得到授权的人员使用系统。必须执行对授权使用信息的人员的身份验证。

2. 对使用过程的审计跟踪。必须维护信息使用方面的审计跟踪日志。

HIPAA,SEC 17a-4,Sarbanes-Oxley 和 21 CFR Part 11都包含与上述两点表达类似的条例。美国大多数州已经通过立法,要求公司在信息安全遭受侵入和个人信息被泄露给窃贼或其他非授权人士的情况下向公众披露情况。此外,HIPAA对病人记录信息尤为严格。

ApacheHadoop的开发团队承认该软件缺乏自主的“线级”安全机制。他们指出,Hadoop用户有能力使用Kerberos网络协议,该协议是通过使用密钥加密和分配技术来提供身份验证。然而,使用Kerberos对于大企业和公共部门的IT管理人员来说至少有两个方面的问题。首先,登陆认证是由集中的密钥分配中心(KDC)所控制的。黑客是有可能入侵KDC并冒充任意一个授权用户的。其次,基于Kerberos的构架原理,对于Hadoop集群的每一个节点都将需要一组不同的主钥密码,这将额外增加管理的复杂度。

Hadoop所需要的是实现基于能够启动并维持安全连接机制的自主用户认证。服务器之间的通讯,包括集群节点之间的通讯和远程过程调用(RPCs),也都需要被保护。从IT运行的角度来看,自主安全应该适用于:

1. 用户操作:比如文件读写,数据库操作和MapReduce任务提交。

2. 集群内部节点间的通讯:包括远程过程调用。

3. 集群间管理:比如镜像。

因此,Hadoop安全性不应取决于KDC用户或者任何其他第三方机构的执行。如果使用自主认证密钥,Hadoop管理员应该能够凭借在集群内部和集群间使用同样的密钥来操作系统。通过对Hadoop里文件和文件夹执行全面的POSIX控制也可以解决访问控制的问题。访问控制列表(ACLs)可以被应用在:

1. 表格,列簇和列。

2. 集群和卷。

3. MapReduce任务和排队。

迄今为止,讨论集中于用户认证和访问控制。然而,静态数据安全也为越来越多的企业所关注。相应地,磁盘生产商业已提供磁盘水平的数据加密。这将有效地防止数据泄密,比如说当磁盘从服务器上拆除以后。因为大型的Hadoop用户往往需要频繁的磁盘更替,我们预期Hadoop将对磁盘水平加密使用逐步增加。

灾难恢复和业务连续性 银行和金融服务业被许多联邦,州和行业机构所监管。重大事件比如9.11和卡特里娜飓风发生后,这些监管银行和金融服务业的机构也要么要求或是强烈推荐对于IT系统的灾难恢复和业务持续性能力的实施。

医疗保健机构也将IT灾难恢复和业务连续性的能力写入规章。HIPAA要求应用应包括数据关键性分析,数据备份计划,灾难恢复计划,应急操作计划和测试及修正流程。FDA颁布的临床试验计算机系统指导原则 要求包含“在遭遇计算机系统失常时利用其它方法继续研究的应急计划,并书面记录此流程”。此外,联邦能源监管委员会(FERC)日前正在建立能源基础设施安全办公室,该办公室将负责应对一系列电力,天然气和石油运输系统的威胁,包括持续的可应用性以及失去IT系统支持时的恢复性。

未完待续

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
多因子身份认证
多因子身份认证(Multi-factor Authentication Service,MFAS)的目的是建立一个多层次的防御体系,通过结合两种或三种认证因子(基于记忆的/基于持有物的/基于生物特征的认证因子)验证访问者的身份,使系统或资源更加安全。攻击者即使破解单一因子(如口令、人脸),应用的安全依然可以得到保障。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档