这一年,蓝鲸平台从自动化运维平台,重新定义为研发运营一体化平台,实现了CI、CD、CO的IT管理全生命周期的打通。
#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包 yum -y install bc sysstat net-tools 巡检项信息,可根据实际需求修改增加 1)、系统基本信息 2)、cpu信息 3)、ip网络信息 4)、cpu使用率 5)、连接数信息 6)、系统限制信息 7)、内存使用信息 8)、磁盘使用信息 9)、网络流量情况/系统资源变化 10)、cpu消耗情况前10排行 11)、cpu消耗按内存情况前10排行 12)、磁盘io情况 13)、系统定时任务列表 1
这里只列出部分结果,其它的详细内容可以参考:https://share.weiyun.com/5lb2U2M
大卫说:关于构建自动化运维平台的相关内容,此前本公众号已经分享过很多篇文章,如: 大卫的思考 | 金融行业自动化运维的研究和落地 Ansible Tower管理Windows演示 | 自动化运维落地之路 谁说互联网企业IT运维必须DIY? | Github排名第一的自动化运维工具 自动化运维界的独孤九剑 | 尽破各路IT运维难题 我们知道,在金融行业,用户要构建的自动化运维平台,应当是能够跨多种平台的一体化运维,而不是将物理机、虚拟化、各种Linux、各种UNIX、各种网络设备、各种硬件等,单独构
百度大厦的一名安保人员手机里弹出这样一条信息。发信息的是他的“新同事”,一位近期上岗百度深研大厦的智能助手——小度巡检机器人。
首先将DB_TiDB_HC_lhr_v7.0.0.sql和pt-summary这2个脚本拷贝到有mysql客户端的Linux环境中,然后执行如下命令:
前段时间在GitHub[1]上发现了一个Ansible巡检服务的Roles, 今天给大家分享一下!
首先看 CPU 内存、硬盘 io 的消耗程度,其中重点是硬盘使用率,要做好准备,避免厂家期间业务写入增长,磁盘占满。
运维服务一个项目二十多台(或者多台)服务器,每天要做服务器的性能巡检工作是查看服务器的CPU、内存、磁盘空间是否在正常值范围内。像这样每天或者每个固定时间段都做相同的重复工作,为了简化重复的工作,我写了基于liunx服务器的自动巡检脚本,在crontab中设定一个固定时间进行自动执行即可,以减少人工重复劳动的工作。
全部介绍请参考:https://www.xmmup.com/shujukuxunjianjiaoben.html
3、跨平台,只要有SQL*Plus、mysql、MSSQL客户端(SSMS、Navicat皆可)、psql环境即可运行脚本
攻防演练建议站在黑客的视角下,审视其攻击流程,再针对性的进行防守,防止出现木桶效应,即攻击者只会从短板攻入,但构建的防守措施却和短板无关。
2018年12月,经过嘉维蓝鲸项目组近半年的努力奋战,太平集团成功上线了蓝鲸研发运营一体化平台,实现了IT运维全流程标准化和调度自动化,并取得了如下收益:
在运维中需要对主机业务进行周期巡检,为减少人工巡检频率,降低业务停机风险,利用 shell 脚本对 Linux 系统服务运行状态进行主动巡检,异常服务通过钉钉机器人进行告警消息推送。
做云安全运营也有一年多时间了,对云上安全建设和运营有一点粗浅的经验,希望可以抛砖引玉,借此文章能有机会和大佬们交流 安全运营,安全建设方向的经验。
又到周末了,思前想后不知道写点什么,那就从以前经历的一个线上缺陷说起,聊一下软件质量保障的巡检技术。
继上两篇巡检相关脚本后,有小伙伴问小编有没有网络设备相关的巡检脚本或工具,今天小编给大家分享个群友给的巡检工具。
中国移动通信集团北京有限公司(下称北京移动)成立于1999年,隶属于中国移动通信集团公司,秉承“正德厚生,臻于至善”的企业核心价值观,紧密围绕“做世界一流企业,成为移动信息专家”的战略定位,以卓越品质锻造一流信息服务,用创新精神努力实现从优秀向卓越的新跨越,着力推动“移动改变生活”。
本文根据MOS文章:Oracle Exadata Database Machine EXAchk (Doc ID 1070954.1)整理关键步骤。 注:通常都会要求使用当前最新可用的EXAchk版本进行健康检查。
上次分享了Linux的信息收集脚本,有小伙伴说实际环境中还有不少Windows的机器,今天给大家分享个Windows服务器信息收集脚本以及使用方法,详见下面具体信息。
“不想当将军的士兵不是好的战士”、“不想当CIO的DBA不是好的运维”。在每天面临如此多的来自工作量、运维安全、技术更新挑战的同时,我们还需要不断的成长与思考:
SFS轻量级Linux工具箱是一款免费运维工具箱, 工具箱内集成一键自动化处理脚本与半自动化处理脚本, 快捷启动工具与菜单方便快速访问执行。 工具箱脚本存储于国内服务器,每个功能执行速度提升无需等待, 简洁易懂的工具箱首页面板数字化执行命令, 多样化功能菜单提升Linux运维效率 一键自动化脚本安装无需分布式部署 轻量级工具箱占用内存低于1M扩展性能强大 每个功能代码专业人员审查处理 无任何木马病毒破坏计算机代码 无任何漏洞侵占用户数据行为 部分功能来源于网络搜集 部分功能来源于个人开发魔改 部分功能来源于投稿合作
目前一共包含7个脚本,若脚本的扩展名为“.sql”则表示该脚本为sql脚本,若脚本的扩展名为“.pl”则表示该脚本为perl脚本。 对于Oracle的SQL脚本而言,脚本DB_Oracle_HC_lhr_vxxx_10g.sql适用于Oracle 10g数据库,脚本DB_Oracle_HC_lhr_v6.0.8_11g.sql适用于Oracle 11g的数据库,脚本DB_Oracle_HC_lhr_v6.0.8_12c.sql适用于Oracle 12c及其以上版本,这3个脚本都是只读版本,这3个脚本只会对数据库做查询操作,不会做DML和DDL操作,这也是很多朋友所期待的功能。 脚本DB_OS_HC_lhr_v6.0.7.pl是perl脚本,执行后会对OS的信息进行收集,并且输出到html中。 脚本DB_MySQL_HC_lhr_v6.0.8.sql是MySQL脚本,执行后会产生MySQL的健康检查html报告,该脚本为只读脚本。 脚本DB_MSSQL_HC_lhr_v3.2.sql是SQL Server脚本,存在部分DDL和DML操作,执行后会产生SQL Server的健康检查html报告。
和PostgreSQL数据库相似,需要有psql客户端或者有人大金仓的ksql客户端都可以,运行方式如下:
当然,查看当前的磁盘和内存使用情况df -h,free -m,是否使用numa和swap,或是否频繁交互信息等。当然,还有其他的监控项目,这里就不一一赘述了。 除此之外,还需要关注日志类信息,例如:
9月底的时候,我们团队负责的两个系统在几周内连续发生了两次线上的生产故障,虽然最后并没有发生严重的损失,但是领导免不了要提一些更高的要求,围绕 保持安全稳定,避免故障再次发生 这个目标需要梳理种种可能的优化措施,也借此机会来梳理下我对于如何做好运维管理工作的一些看法,欢迎各位同行批评指正。
首先看 CPU内存、硬盘io的消耗程度,其中重点是硬盘使用率,要为长假做好准备,避免单位在过年期间业务写入增长,磁盘占满。
export CLASSPATH=:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
Linux系统需要定期巡检,以检查服务器软硬件使用情况,相当于对人的体检,确保可以及时发现问题、解决问题,降低损失,常用的巡检命令如下:
依托飞桨开源深度学习框架和丰富的工具组件,PaddleX进行全流程的整合打通,为开发者提供飞桨全流程开发的最佳实践。它集飞桨核心框架、模型库、工具及组件等深度学习开发所需全部能力于一身,提供简明易懂的Python API,方便用户根据实际生产需求进行直接调用或二次开发,是提升深度学习项目开发效率的最佳辅助工具。这套工具的公测版于2020年3月30日在飞桨官网上发布,我们诚挚地邀请您试用,并根据您的意见不断进步及演化,让它助力每一位深度学习开发者实现无限创造。
Oushu Database(简称OushuDB)是新一代极速云数仓,让企业用户轻松构建核心数仓、数据集市、实时数仓以及湖仓一体数据平台。OushuDB由国人自主研发,符合国家信创标准;通过计算存储分离架构解决了传统数据仓库高成本、高门槛、难维护、难扩展的问题。同时支持各大公有云和私有云。
“上线了易点易动系统之后,设备的信息都绑定了二维码,巡检任务会自动推送到我们手机,避免了遗漏巡检。定期对设备进行巡检和点检变得简单。一旦设备出现漏检,通过二维码信息管理后台会一目了然,方便及时消除设备存在的安全隐患。”某电厂的人员说。
中移信息平台能力中心数据库团队成员,主要负责 MySQL、TiDB、Redis、clickhouse 等开源数据库的维护工作。
巡检平台是一个面向运维人员的开箱即用的巡检产品,提供自动诊断问题的自动化运维能力。产品不仅提供了自动化的巡检能力和巡检报告给运维工程师使用,还针对巡检报告中的问题提供了运维专家经验的优化建议供修复时参考。运维人员也可以根据自己的定制需求,通过多样化巡检原子能力灵活定制个性化巡检项加入到定期巡检任务中,巡检原子能力包括脚本巡检、HTTP(S) 接口巡检和 IP 巡检;该平台还具备覆盖多个垂直产品和多个维度巡检的分类能力,运维人员可以根据产品归属不同人员等方式,让不同用户订阅不同的巡检报告,从而大大减少运维工程师定期手工巡检的工作量。
对于生产制造型企业而言,随着企业规模的扩大和产量的增加,生产设备的稳定和安全运行就成为企业效益的重要保障。减少设备故障、科学合理保养设备以延长设备的生命周期,从而杜绝设备的安全隐患,避免因设备停工带来的损失成为企业管理者们关注的重点。
腾讯数据中心电子巡检系统是一个综合的移动智能信息应用平台,实现了无纸化数据采集、实时上传,任务自动激活,实现了巡检管理的数字化、信息化、规范化、智能化,有效的降低人为因素带来的漏检或错检等问题,最大程度提高工作效率,为巡检管理工作提供了科学的手段。 牛皮不是吹的 火车不是推的。首批试点用户——广州电信永顺数据中心、广州移动华新园数据中心发来这样的反馈: 首批用户 在10月18号(十九大开幕大好日子),我有幸亲自体验了PAD端的电子巡检系统,大致有如下几点体验: 质量方面: 1.属地机房可以根据现场房间、
蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。
设备巡检系统是通过引入二维码、云计算、移动互联等技术,为生产企业提供设备管理和巡检的解决方案,以确保设备巡检工作的质量,提高巡检工作的效率。设备巡检系统的目的是掌握设备日常运行的动态和状态,及时发现设备的缺陷以及安全隐患,让维修、保养、巡检、备件更换更及时,保障设备的运行安全,减少停机时间,提升设备寿命和工厂的生产率。
领取专属 10元无门槛券
手把手带您无忧上云