首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

浅谈IT系统运维检查的工作内容

信息资产统计工作

基本工作包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。

内容包括:

1.硬件设备型号、数量、版本等信息统计记录;

2.软件产品型号、版本和补丁等信息统计记录;

3.网络结构、网络路由、网络IP地址统计记录;

4.综合布线系统结构图的绘制;

5.其它附属设备的统计记录。

网络、安全系统运维工作

从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。

用户现场技术人员值守

保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。

现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。

同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:配置数据、性能数据、故障数据。

现场巡检工作

现场巡检工作是进行全面检查的项目,通过该工作内容可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。

巡检包括的内容如下:

网络运行分析与管理服务

网络运行分析与管理工作是通过对网络运行状况、网络问题进行周期性检查、分析后,提出指导性建议的一种综合性高级服务。

主机、存储系统运维服务

主机、存储系统的运维服务包括:

主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。

主机存储系统基本服务内容:

现场备件安装,补丁服务,升级服务,现场故障诊断,问题管理系统,系统优化。

运维监控管理

包括:CPU 性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。

数据库系统运维服务

数据库运行维护工作是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。

此外,运行维护工作还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。

中间件运维服务工作

中间件管理是指对BEA Weblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管理、故障监控、性能监控。

执行线程:监控WebLogic配置执行线程的空闲数量。

JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。

JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。

检查WEBLOG日志文件是否有异常报错

如果有WEBLOG集群配置,需要检查集群的配置是否正常。

约上小伙伴,来pick 一下吧!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190923A0BX9F00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券