展开

关键词

所需技能体系

在这个生命周期中的每个阶段都有可能参与: 设计阶段: 主要针对系统架构设计的合理性进行评估,包括是否存在单点,是否可以容错,是否有强耦合等。 通过的基本工作,我们来看看一个人员需要掌握的知识体系: 操作系统: Ubuntu,CentOS,Redhat web: nginx,apache ,tomcat 监控: zabbix 在众多的技能体系中,很多人习惯于研究一个又一个关键永远都学不完。其实的发展是从最原始的人工阶段慢慢过渡到工具和自动化阶段,最后才是平台化阶段。 很多人提高了智能,其实智能的应用已经在国内的百度,搜狗,阿里等企业开始尝试和摸索。 目前智能主要被用于故障分析,根据故障的现象,快速定位问题。 智能还不是小公司的研究范畴,但总有一天会被普及。当然我们也不必因为智能的发展而忧心忡忡,毕竟时间万物的发展,有新的事务出现,必将有新的岗位代替旧的岗位。 我们只要用心去掌握新岗位的技能就行了。

51420

体系建设套路

先谈流程体系的建设: 新时代的已经不涉及IDC机房,交换机,路由器,服务器硬件,各种中间件和基础组件。 这种现状会让会站在从研发到应用交付的层面上看待保障工作,因此的规划可以集中在研发效能体系建设,监控体系建设,变更体系建设,最后是运营体系建设。 先谈一下基础体系--变更体系,线上的变更:涉及到基础层,应用层,应用层,业务层, 变更的所属层级越低,影响面和破坏力就越大。 专业技术方面的建设: 发现问题是监控体系干的事情,解决问题是事件管理/问题管理等偏向技术运营体系干的事情, 两者相互促进。 告警事件产生的问题/或者人为反馈的问题(技术相关的),转交到人员手中,人员有不同的处理方式来解决。一种是较浅层次就事解决事。

24010
  • 广告
    关闭

    【玩转 Cloud Studio】有奖调研征文,千元豪礼等你拿!

    想听听你玩转的独门秘籍,更有机械键盘、鹅厂公仔、CODING 定制公仔等你来拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    开发体系梳理

    这是学习笔记的第 1890 篇文章 今天把开发的体系做了一层梳理,基本把一个整体的脉络理清楚了,这部分的内容也会不断萃取和整理,希望能够给大家一些参考。 ? 所以把shell也揉入了进来,基本的系统管理和脚本开发是开发的基本功。 基于web的开发技术,是在基础开发的部分衍生出来的,掌握了基本的Python技术不一定能够完全掌握基于web的开发技术,因为不是完整的一个技术栈,web方向涉及的知识体系相对要大得多,而且会很杂。 架构和设计是开发里面的难点部分,其中自动化的架构设计部分就好比是画一幅画,如果把轮廓画好了,基本上画的质量和效果是可以预见的。一个松散没有良好架构设计的系统是很脆弱的,也是经不起考验的。 管理模块我会主要从基础,备份恢复,高可用管理,分布式管理几个部分进行产品设计和集成实现。

    60520

    浅谈工具体系

    行业正在变革,推荐阅读:30万年薪Linux工程师成长魔法 流程管理工具 发布变更流程管理工具:做为系统接口与其他角色的工作衔接。并提供审批环节控制发布变更的风险。 发布变更工具 版本管理工具(数据库):所有的发布应该以版本管理为起点。研发给的版本包先入版本管理工具,再从版本管理工具分发到现网发布。杜绝 rsync 一台服务器发布另外一台的做法。 资源管理和隔离工具:以xen/kvm为代表的工具让可以更灵活的切割资源。比如虚拟机的快速起停,ip在idc内的漂移等。以 lxc/docker 为代表的工具让可以进一步的切割资源到进程级别。 监控告警工具 采集工具:一般是采集日志文件,也可以是定时轮询 DB 或者其他系统的接口。流行的开源方案是 logstash。 收集工具:采集工具上报给收集工具。 事件数据库:记录所有的告警。包括从其他系统获得告警,以及对现网的所有变更操作记录。这些数据用于支撑告警的原因定位。

    99380

    开发体系升级的思考

    这是学习笔记的第 2367篇文章 在大概4年前,我们算是从0到1的构建了现在的数据库开发体系,这个过程有较长的启动周期,从我个人主导到后来的成员独当一面,从零星的功能建设到现在有了相对体系化的建设 开发这件事情的理念契合,我们花了很长的时间,限于有限的资源和技术储备,我最终选择了Python技术栈,其实第1年是最让我焦虑的,这种焦虑打个比方,就好像我是司机,手里拿着方向盘,车上的乘客的心态是和我完全不同的 Python技术体系的学习和构建。 当然在这个过程中也总结了一些经验,比如对于模块化的思考,早期的OpsManage体系的构建是一个相对独立的Python服务,随着业务的接入,有了MySQL,Redis等数据库,为了对一些功能和技术栈有所区别 我开始构建新版本的开发环境,打算从整体设计上能够有所侧重,同时对已有的开发体系进行认真梳理和复盘。

    20330

    如何实现MySQL体系建设

    内容来源:2018 年 10 月 20 日,源数据库论坛(ODF)发起人周彦伟在“ODF走进名企之贝壳技术沙龙-数据库存储技术的多元应用”进行《使用ArkControl实现MySQL体系建设》的演讲分享 阅读字数:2384 | 6分钟阅读 摘要 本次分享的是如何使用ARkcontrol来搭建mysql的体系,从功能、架构以及安装内容上来详细介绍ARkcontrol。 最终我们做了一款叫ArkControl的产品,他是一个云管平台,社区版可以免费下载使用,可以一键实现一个比较全面的mysql体系,不用花费太多成本就能实现一些数据库的基本功能,至少不用再通过命令发去安装 最左侧从主机管理到下面的审核审计这部分展示的是AkrContro能提供的功能,这些都是为了满主开发者对数据库的需求。 还有很重要的一块,也是今后我们发展的重点——智能,包括数据库的智能优化,智能的诊断和巡检。实现逐步的从人工的转化为智能,类似最优化接口或最优化配置等功能。

    39540

    平台规划体系全介绍

    识别平台的边界在哪儿,才能更好的构建平台,从而协助的日常工作。 在之前的文章中,谈到过【的本质--可视化】,在可视化的篇幅中,着重介绍自动化的可视化和数据的可视化;在后续的篇章中又介绍了【互联网的价值体系】,里面分解了几个维度:质量、成本、效率、安全等。 找到一个价值方向来牵引整个团队很难,但又必须找到,因这个牵引力就决定了团队的气质及后续的工作方法;之前的【价值体系】有详述,在此不细谈。 和之前【数据驱动】介绍过的,我做了一个数据的分层体系。 8、监控及服务,有数据的地方才有监控。脱离这个原则,你做的都是告警。 每个维系统都有任务或者信息与自己相关,如果人员每天要去面对那么多的维系统,会非常痛苦。

    2.5K11

    谈谈我理解的体系

    我写这个文章的动机,还是因为在会后很多人问我,“一个全局的体系应该是什么样的?”。这篇文章就给大家一个初步的回答。 ? 价值体系(value) 我在任何场合都在强调运价值/IT价值和用户价值之间的关系,在精益的分享中,我推导过,用户价值可以通过IT价值相互转换的。 那Dev技术架构体系和我有什么关系呢?他决定了你维护成本的大与小,维护质量的高与低,维护效率的快与慢!否则,你只盯着平台,认为都是平台的事情。 技术标准有了,业务的碎片便没有了! 平台体系(platform) 的平台体系,这个我在外面讲得很多了。 不基于产品的执行路径,大到你的目标设定和分解下来的roadmap,比如说平台体系的构建;小到你的流程,比如说事件流程、资源池管理流程等等。

    80300

    水平|产品的能力闭环体系

    实现一个产品的闭环,比碎片式的产品建设更有意义。 抛开我最近创业对这一问题的必要性思考,回归到一个企业内团队本身,个人觉得也需要思考这个命题。一个完善的平台才能做到对业务的运营有效支撑。 但随着后面应用平台的一体化能力不断增强(比如说腾讯织云/蓝鲸),此时就对底层的平台能力开放性要求越来越高。 当然这个地方我建议分成如下三个阶段: 1、独立的按照核心角色需求建设平台。 此时我们谨记:即IT运营。 腾讯的织云平台是一个场景化/一体化非常高的平台,是腾讯SNG部门的核心平台,点击{阅读原文}详细了解。 以上的域名能构成一个全自动化平台的能力体系。 5、监控域。 精细化/实时/端到端的数据采集/处理/分析体系是运营价值的核心部分。 坚持产品的垂直与水平闭环体系,才是一个做出一个真正好用的平台!

    74900

    初探精益体系|多图

    有一种努力一直放在心中,想更系统的表现,内心的这份冲动源于两点: 1.在互联网化业务的今天,的作用可以被更重视。 2.需要更体系化,更理论化,更实践化的阐述。 在之前,我用过价值化来概括过,我也多次在文章中或公开演讲中提到应该关注“面向用户的价值“,但我依然觉得还是不够精炼。 直到后来想到了“精益“这个词,把它和做了一次融合,只因精益思想的背后,很多观点都和我们很契合。接下来看看我在《全球运大会|上海站》上分享的主题——面向高性能IT的精益体系。 精益团队也需要有“精益”的气质,里面有对一线人员的经验和价值的尊重和重视;内建价值体系,仅仅质量体系还不够,分质量/成本/效率/安全等等。 ? 如何达到精益,这个时候需要一些标准实践。 比如说自动化一切/持续交付;维和线上服务的度量;端到端监控;标准化,无论是业务的标准化还是工具的标准化等等。 这只是一个初步的精益体系框架,还有很多内容值得细化和深入。

    1.1K10

    高屋建瓴地规划自己的体系

    要做的事情与岗位职责内容密切联系,可能有了要做的事情需求,因此设置了岗位和人员,但也有因为有了这个岗位的人,因此创造了一些事情。 这有点“鸡生蛋、蛋生鸡”的逻辑。 1 维系统架构 每个公司的IT 环境,不论大小复杂度,总会有个系统架构层次。有了这个架构体系,那所有的事情大体都围绕着这个系统架构上的每个元素及整体进行运保障工作。 去IOE 过程,其实是系统架构的更新换代,产品的更新换代,理念的更新换代,人员的更新换代,知识体系的更新换代,等等。因此如果贸然去IOE,可能既不会降低成本,也不会提高效率,更不会稳定架构。 自身业务是否真正需要大数据、云计算以及分布式这种海量体系。 是否已经考虑好系统架构、理念、人员、知识更新换代的方案。 做好日常基础工作,保障好生产业务运行。不断探索新的理念与技术,探索优化系统架构。最重要的是要明白什么是正确的事,怎么正确地做事,做事有章法,才能实现稳定高效能。

    33110

    垂直|产品的能力分层体系

    一个好的产品分层体系,是平台理解清晰与否的标志。 建设一个完整的平台,绝非一日之功,也非一两个平台所能覆盖,因此我非常喜欢用分层体系来归纳问题。 无论是整体产品的规划体系,还是自动化体系,还是数据化体系,甚至说CMDB平台的资源体系,都可以用分层归纳总结。以下是我对产品整体分层体系的理解: ? 该能力在依赖平台的同时,更依赖的是团队的业务理解能力和经验总结。 这一层的能力都表现为一个具体的产品形式+运营方法,从而确保能够很好的闭环起来。 ;是基于角色的,而非基于单一用户的--的角色能过清晰定义场景需求,用户的需求往往是片面而不真实的需求;基于事务的,而非基于职能的--事务能过跨越职能组,让组织的自动化和数据能力流动起来; 平台能力是指基于底层平台构建起来的自动化 通用能力层 通用能力层是基于基础设施之上封装的公共服务能力,这层架构的能力分成两部分:一部分是面向业务技术架构的,另一部分是面向服务架构的。

    72711

    GOPS2018--腾讯体系专场回顾

    当然是GOPS全球运大会--腾讯体系专场了,几位老师给大家带来了一场思想盛宴。活动圆满结束!~ ? 下面跟着小编来去看看活动现场盛况,感受几位讲师的风(yan)采(zhi)吧。 ? 首先,让我们隆重地请出本次专场活动的出品人兼主持人--腾讯总监聂鑫,从开发到,伴随社交网络运营部成长的十年,负责过腾讯社交产品所有业务工作,见证了整个SNG体系的建立,发展和成熟过程。 分享主题是《社交业务基础技术架构选型与演进》。演讲回溯了10多年的变化,从响应社交业务迸发开始,到满足业务需求同时并且切入主线做标准化。 基础技术持续演进,自动化能力提升,业务高效调度实现,最终实现支撑一人万台,高效自动化先进体系搭建,以及AIOps能力。小编在台下听到有人夸赞老师有深邃的眼神,嗯,我去私信转达一下老师。 最后,由数学博士张戎压轴,带来《腾讯场景的 AI 实践》,结合QQ的场景,介绍在日常的方面,如何使用机器学习的算法来实现智能

    1.5K110

    纯开源产品打造初创公司体系

    纯开源产品打造初创公司体系 结合自己所知及个人喜好,总结汇总了下面这个列表。 12、维语言 名称:Python 官网:https://www.python.org/ 简介:Python 是一种面向对象的解释型计算机程序设计语言,是纯粹的自由软件, 源代码和解释器CPython遵循 13、自动化 名称:Ansible 官网:https://www.ansible.com/ 简介:Ansible是新出现的自动化工具,基于Python开发,集合了众多运工具(puppet、cfengine Jumpserver 官网:http://www.jumpserver.org/ 简介:Jumpserver 是全球首款完全开源的堡垒机,使用 GNU GPL v2.0 开源协议,是符合 4A 的专业审计系统

    75220

    的目标价值体系

    价值的提炼,直接决定了团队(个人)对理解的高度和精度! 从很多传统的视角去看的确承担了很多职能,但这些职能还是都和具体的岗位相关,如下: ? “保姆”/“救火”/“苦逼”好像就是的标签,难道我们的真的只能如此?这篇文章就和大家好好谈谈的价值在哪儿?让大家看看都能做些什么? 具体的个人理解如下: 一、质量(Quality) 我们还需要从经典的质量定义开始,用【层次分析法】逐渐打开,去认识质量体系的全貌。 数据要建立分级体系,不同的数据分级需要有不同的管理策略和数据使用策略,这些策略包含访问密码加密、访问日志的脱敏、数据隔离访问、数据加密、数据的备份、数据的加密获取等等。 在后续会推出一系列的文章来多角度,多层次的来看,提前给出如下(排名不分先后): 1、【平台篇】平台建设规划总体系介绍 讲讲我规划的几个平台体系

    1.9K11

    如何建立有效的安全体系

    随之而来的是业务长时间中断,使行业带来前所未有的挑战。此次技术分享意在让大家对企业安全有一个直观的认识,能够迅速融入企业安全体系,胜任应急响应任务。 目录: 安全 1.操作系统安全 —-漏洞扫描 2.网络安全设备 —-硬件防火墙 —-IPS —-网络安全设备在大型网络中的应用 3.安全准则 4.应急响应 安全体系的思维导图,基本涵盖了所有的常见漏洞类型及详细分类 三.安全准册 【1】端口回收 ,谨慎开放端口,关闭一切不必要的服务。 【2】权限最小化 ,禁止使用root用户启动服务,日常维护使用普通账号。

    2.1K80

    一文帮你理解整个 SRE 体系

    可观测系统是整个体系的基础,它需要提供整个体系的数据化支持。 因此,一个企业级的可观测性系统应该是平台化的。 SRE从内心上鄙视重复性的工作,将从原有的人工加被动响应,转变为更高效、更为自动化的体系。 自动化框架: ? 构建自动化体系就必须以场景为基础,这些场景是在本企业内反复迭代和打造,是企业中最常用的场景。 因此,整个自动化体系建设时也应支持多种不同类型的自动化作业配置能力,通过简单的脚本开发、场景配置和可视化定制流程实现更多运场景的实现。 最终形成从业务用户体验数据入手,逐步实现系统运行状态数据、设备运行状态数据链路的打通,让体系实现以最终用户体验为中心的目标。

    93341

    平台体系,你们真的有好好规划吗?

    识别平台的边界在哪儿,才能更好地构建平台,从而协助的日常工作。 在之前的文章中,谈到过“的本质——可视化”,在可视化的篇幅中,着重介绍自动化的可视化和数据的可视化;在后续的篇章中又介绍了“互联网的价值体系”,里面分解了几个维度:质量、成本、效率、安全等。 找到一个价值方向来牵引整个团队很难,但又必须找到,因这个牵引力就决定了团队的气质及后续的工作方法;之前的文章“价值体系”有详述,在此不细谈。 之前的文章“数据驱动”中介绍过我做的一个数据分层体系。 监控及服务,有数据的地方才有监控。脱离这个原则,你做的都是告警,并且告警的成本会越来越大,不成体系。 作者简介 王津银 07年进入腾讯公司接触,先后在YY和UC参与不同业务形态的,对有一些理解。

    1.1K01

    扫码关注腾讯云开发者

    领取腾讯云代金券