云计算下的企业IT运维

云计算管理员们一般都工作在一个分布式局域网计算基础设施中,它与传统数据中心最大的区别之一就是,所有被存储、调配和管理的数据都在一个私有云中。基于云计算的高效工作负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。了解你的云计算运行详细信息将有助于交付一个更强大的云计算使用体验。

收集云计算性能指标

  IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。对于云计算服务器来说,过度分配资源或分配资源不足都是一个需要付出高昂代价的错误。

适当的规划和工作负载管理是任何重大云计算部署工作之前必须实施的环节。当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数:

  CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。当无数用户从云计算启动桌面服务或应用程序服务时,必须认真考虑这台服务器需要多少个专用核。

  RAM需求:基于云计算的工作负载可以是RAM密集型的。在一个特定服务器上监控一个工作负载,可允许你衡量分配多少的RAM资源。其关键在于按需规划而不过度分配资源,你可以通过工作负载监控来实现这一目标。通过查看一段时间内RAM的使用情况,管理员们可以确定何时将会发生使用高峰以及相应合适的RAM等级。

  存储需求:规模规划是云计算工作负载的重要一步。用户设置和工作负载分配都需要空间资源。还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。你可以使用固态硬盘(SSD)或板载闪存缓存以阻止I/O高峰。

  网络设计:网络及其架构在云计算基层设施与工作负载中起了一个非常重要的作用。监控数据中心和云计算内的网络将有助于确定特定速度需求。从服务器到SAN通过10GbE连接的光纤交换机上行链路将有助于减少瓶颈和改善云计算工作负载性能。

  性能监控工具也是非常有用的。通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。

工作流程自动化的优势

  主动云计算工作负载监控可执行收集指标和统计数据的任务。在发生应用高峰时,许多系统都可以监控工作负载并提供工作流程自动化服务。

  某些诸如旅游业这样的市场,往往在一年中的特定时间段会发生使用高峰事件。为了应对这样的突发事件,可以设置工作负载阈值,以便于一旦需求增加超过预设值时可创建新的虚拟机。因此,最终用户将总是可以访问数据和保持正常的工作负载,而无需做出性能牺牲。

  工作流程自动化还有助于灾难恢复和备份等任务。由于在无数网站之间发生了数据复制操作,因此当另一个网站发生数据丢失时,远程的另一个网站就会承担这一工作负载。适当的工作负载监控和数据中心设计可以有助于提升系统的稳定性,而更为重要的是提高业务的连续性。

云计算监控提示

  这里列出了一些有助于保持你私有云工作负载正常运行的规则:

  了解你的物理资源。尽管在最初的时候物理资源似乎是无穷无尽的,但是事实上它们终究是有穷尽的。如果没有适当地监控和调配这些资源,这些资源会非常迅速地被用尽。云计算工作负载可以提出需求。规划是必须的。

主动保留运行日志。除了主动地监控云计算工作负载,云计算管理人员应当记录在一段时间内这一工作负载或服务器是如何运行的。云计算服务器可以升级,工作负载可以在不同物理主机之间迁移。在这些情况下,知道特定新旧服务器是如何分别设置运行可以有助于计算拥有总成本和投资回报。在很多情况下,良好的性能日志可以提供有用的统计信息以便于证明数据中心新增预算的合理性。

监控端点。从数据中心的角度来看,工程师能够监控和管理活动的工作负载。在端点处监控工作负载活动也是非常重要的。通过了解工作负载是如何被传递、是如何被接受,IT团队可以创建一个更为积极的计算体验。

当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。在某些情况下,管理员们可能要使用到数据压缩或带宽优化等技术,从而使工作负载在端点处正常运行

本文分享自微信公众号 - 马哥Linux运维(magedu-Linux)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-07-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏强仔仔

基于Java EE新闻管理系统的设计与实现

1、设计目的  本产品是为喜欢关注社会中各类新闻的用户而开发的一套新闻管理系统,旨在向用户提供最及时真实的新闻资讯,让用户更加方便快捷地了解到其他地方所发生的各...

749100
来自专栏服务端技术杂谈

重构系统的套路-明确重构目的

我们进行系统重构会抱着不同的目的,比如为了系统稳定性,为了系统中某些功能负载能力更强,为了系统更便于维护,或是为了系统更便于持续集成提升RD和QA的人效。

68030
来自专栏开源优测

从小白到菜鸟:持续集成说

1.1引言 持续集成的价值是什么?对于开发和测试人员又意味着什么呢? 1.2概念 “持续集成”一词来源与极限编程(Extreme Programming),...

50880
来自专栏ml

html学习第一讲(内容html常规控件的的使用)

1 <html> 2 <head> 3 <title> 这是网页的标题</title> 4 </head> ...

32350
来自专栏WeTest质量开放平台团队的专栏

又崩溃了!服务器:“怪我咯?”

某公司新开发了一款大IP手游。上线之后不久,发现几十个人上线之后服务器就崩溃了。一开始还能用大量预算来购买服务器用以支撑,但几天之后由于宣传火爆,随着用户的增多...

23520
来自专栏云计算D1net

从公有云无服务器应用中获得最大收益

无服务器计算可以降低公有云中的应用成本,但企业需要正确的技能才能获得这些,且收获其他收益。 无服务器计算允许组织在更细的颗粒度上构建和部署云应用。与使用单体代码...

378100
来自专栏技术专栏

慕课网数据分析与挖掘实战(一)-数据获取

其中,urllib,urllib2,requests,scrapy主要用于数据抓取 xpath主要用于分析提取有价值的内容 phantomjs,beauti...

45530
来自专栏CSDN技术头条

日志管理与分析的十个最佳实践

这是准确管理与衡量日志记录的最高效方式;本文将带你快速了解通常如何利用Docker及容器来创建易于管理、测试及部署的软件镜像包。 过去十年来,随着分布式系统的发...

30250
来自专栏哲学驱动设计

企业 SOA 设计(2)–组件化产品开发平台

上一篇《企业 SOA 设计(1)–ESB 设计》中,写到我们的 SOA 设计分为两个层面来进行:一个是系统间的 SOA 设计,主要通过 ESB 来完成;另一方面...

23950
来自专栏程序你好

微服务中能付出什么, 得到什么

10630

扫码关注云+社区

领取腾讯云代金券