首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

自动化体系如何入手

持续性的建设就需要一套自动化体系,那么我们应该从何入手?...,主要由应用团队负责,主要包括基础服务、业务应用、中间件等;管理层 管理层,主要由配置管理团队、安全团队、应用团队负责,主要包括各种自动化操作、安全管理、监控管理等;展示层...等等3.5 CI/CD 基于统一的规范前提下,CI/CD可以真正的做到将以上各个层面的想法、解决方案进行落地。因此CI/CD能力很大程度上决定了我们自动化的高度。...持续集成 代码质量测试、单元测试、打包测试、自动化测试等。操作系统交付 遵循统一的规范,交付统一规格的操作系统,完成对平台各个管理节点的资源注册。...4 小结 通过以上各个层面的框架和依据,希望大家能够结合实际情况进行头脑风暴,做到不止于此。 当然自动化建设不是一蹴而就的,需要结合规范、制度、流程去逐步实现。

43930

腾讯+,助力领域技术发展

为了更好地推进领域技术交流发展,并且让更多的企业能够完成向计算的转变,腾讯云和织云联合举办“腾讯干货” 系列沙龙。...每期沙龙将会邀请腾讯领域专家,分享计算时代的思考和实践,并且为参加沙龙活动的人员提供一定金额的腾讯代金券,帮助大家0门槛体验腾讯上各类产品,而针对企业用户,腾讯+创业”计划更是能给出高达百万的资扶持...空间的异地多活的实践分享,从业务的分布规划、条带化梳理、容量管理与数据同步方案,再到调度系统设计、容灾容错的演习和柔性有损的思考,有血有肉的讲述了QQ空间运团队是如何在经历无数的坑与锅后,建成了一套成熟的的异地多活体系...,以2天部署2万台服务器的量化能力开场,以社交业务的节假日活动准备为背景,给大家介绍了SNG自动化的技术与容量压测技术,并从发展的角度提出了团队的价值论,引起了与会者的共鸣与思考。...后续的海量实践,效率与自动化监控与质量,运营成本与规划,DevOps实践主题,AI等主题进行分享,敬请期待。

4.8K10
您找到你想要的搜索结果了吗?
是的
没有找到

GOPS2018--腾讯体系专场回顾

听说4月14日腾讯社交网络运营部八位大咖倾巢出动,齐聚深圳圣淘沙酒店。所谓何事? 当然是GOPS全球运大会--腾讯体系专场了,几位老师给大家带来了一场思想盛宴。活动圆满结束!~ ?...首先,让我们隆重地请出本次专场活动的出品人兼主持人--腾讯总监聂鑫,从开发到,伴随社交网络运营部成长的十年,负责过腾讯社交产品所有业务工作,见证了整个SNG体系的建立,发展和成熟过程。...基础技术持续演进,自动化能力提升,业务高效调度实现,最终实现支撑一人万台,高效自动化先进体系搭建,以及AIOps能力。小编在台下听到有人夸赞老师有深邃的眼神,嗯,我去私信转达一下老师。...下午第一场分享是收获了众多支持的《复杂业务的自动化精髓》,分享嘉宾是QQ平台组负责人--杨利东。...带来了来自腾讯内部的海量社交业务自动化案例,真实数据分享,全方位剖析自动化的理念、能力和孵化过程。老师当天其实是带病上阵,能得到大家的肯定是很开心的~ ?

2K110

FreeWheel 环境治理实践:体系设计

计算正在影响整个信息产业,其可靠性、灵活性、按需计费的高性价比等优势已经让很多厂商把“上”列入到了战略计划中。 相对传统计算为我们节省了很多硬件、网络、甚至一些基础服务的维护成本。...本文将分享 FreeWheel 基于 AWS 服务的维生态体系设计思路:面对内部众多团队,如何在保持“底线”的同时,给用户提供灵活的可变空间、实现裸资源交付与管理。...自动化: 服务树的设计理念为实现统一的、标准的自动化平台打下了坚实的基础, 例如上述的命名标准,访问控制都是自动化平台里不可或缺的部分。...安全性:保障修改后的代码平稳应用到线上 准确性,利用自动化平台结合 TF 的 Dry run 功能保证用户提交代码的准确性,包括语法和预定义的语义检查,以及提交资源修改前的二次确认: 平台支持暂存当前工作目录状态...张成:Senior Manager,任职于 FreeWheel OPS-DEV 团队,负责自动化平台的建设和开发工作。

40120

基于腾讯平台之自动化工具Ansible实践

本篇将主要描述在腾讯平台如何构建Ansible自动化管理工具平台/环境,如何批量管理上服务器,批量分发配置等设置,同时这里将引入某客户真实的案例进行整体的阐述。...主流自动化管理工具Puppet:基于Ruby开发,采用C/S架构,扩展性强,基于SSL认证SaltStack:基于Python开发,采用C/S架构,相对于puppet更轻量级,配置语法采用YMAL,...Ansible环境部署这里为了更直观看到效果,采用3台centos7.6 + 1台ubuntu进行自动环境的构建,如果需要覆盖更多被管主机,则通过下面的方法扩展即可。2.1....案例说明近期某客户基于腾讯镜(主机安全)进行等保安全基线扫描,发现有上百台服务器的安全基线不符合客户安全部门的安全需求,需要进行整改,涉及的机器量也比较大,而客户侧人员较少,日常常用采用简单脚本方式进行管理...一开始比较倾向上的产品进行批量或自动修复,发现比较难找到合适的产品完全吻合,因此这里推荐采用Ansible自动化的方式进行批量修复服务器的安全隐患问题,这里简单列举几项高危风险示例: 序号风险项威胁等级描述处理建议

2.3K160

所需技能体系

在这个生命周期中的每个阶段都有可能参与: 设计阶段: 主要针对系统架构设计的合理性进行评估,包括是否存在单点,是否可以容错,是否有强耦合等。...注: 面试了很多培训机构的学员,他们喜欢说“真实服务器”这个词,这有一种可能是心虚的表现,觉得自己一直在虚拟机操作,即使用过阿里也不敢说自己操作过。会时常把真实服务器挂嘴边。...通过的基本工作,我们来看看一个人员需要掌握的知识体系: 操作系统: Ubuntu,CentOS,Redhat web: nginx,apache ,tomcat 监控: zabbix...在众多的技能体系中,很多人习惯于研究一个又一个关键永远都学不完。其实的发展是从最原始的人工阶段慢慢过渡到工具和自动化阶段,最后才是平台化阶段。...因为自动化的基础是手工可以实现,如果手工阶段实现不了,自动化如何去实现。 很多人提高了智能,其实智能的应用已经在国内的百度,搜狗,阿里等企业开始尝试和摸索。

87020

体系建设套路

当下特点: 当前公有除了让企业不用关心IDC机房,物理交换机,物理服务器外,还提供了功能丰富的基础组件和中间件,让企业侧的不用考虑繁琐的中间件/基础组件的高可用和架构,更加聚焦业务侧...先谈流程体系的建设: 新时代的已经不涉及IDC机房,交换机,路由器,服务器硬件,各种中间件和基础组件。...这种现状会让会站在从研发到应用交付的层面上看待保障工作,因此的规划可以集中在研发效能体系建设,监控体系建设,变更体系建设,最后是运营体系建设。...先谈一下基础体系--变更体系,线上的变更:涉及到基础层,应用层,应用层,业务层, 变更的所属层级越低,影响面和破坏力就越大。...专业技术方面的建设: 发现问题是监控体系干的事情,解决问题是事件管理/问题管理等偏向技术运营体系干的事情, 两者相互促进。

1.1K11

开发体系梳理

这是学习笔记的第 1890 篇文章 今天把开发的体系做了一层梳理,基本把一个整体的脉络理清楚了,这部分的内容也会不断萃取和整理,希望能够给大家一些参考。 ?...所以把shell也揉入了进来,基本的系统管理和脚本开发是开发的基本功。...基于web的开发技术,是在基础开发的部分衍生出来的,掌握了基本的Python技术不一定能够完全掌握基于web的开发技术,因为不是完整的一个技术栈,web方向涉及的知识体系相对要大得多,而且会很杂。...架构和设计是开发里面的难点部分,其中自动化的架构设计部分就好比是画一幅画,如果把轮廓画好了,基本上画的质量和效果是可以预见的。一个松散没有良好架构设计的系统是很脆弱的,也是经不起考验的。...管理模块我会主要从基础,备份恢复,高可用管理,分布式管理几个部分进行产品设计和集成实现。

1.3K20

腾讯干货沙龙-海量实践大曝光 (三)

作者丨周小军,腾讯SNG资深工程师,负责社交产品分布式存储的及团队管理工作。对互联网网站架构、数据中心、计算及自动化等领域有深入研究和理解。...您也可以在腾讯织云公众号下载本次演讲PPT。 一、活动背景 [图片] 有三座大山:大活动、大变更、大故障。这几个场景是最消耗人力的。特别是大活动,非常考验弹性能力,对自动化挑战很大。...我今天所分享的主题就是深入百亿次红包大活动的背后,解析腾讯的方法体系,了解织云平台如何帮助实现大活动高效,如何减少运人海战术。...织云高效的实践是,它是以标准化为基石,以 CMDB 为核心的自动化平台。通过 Web 界面的一键式上,基于业务原子任务和流程引擎,形成一个完整的流程,最后并行执行。...相关文章 腾讯干货沙龙-海量实践大曝光 (一) 腾讯干货沙龙-海量实践大曝光 (二) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

4.8K10

腾讯干货沙龙-海量实践大曝光 (二)

作者丨魏旸:腾讯高级工程师,具有15年经验的专家。负责QQ空间、微云、QQ空间相册等的工作。 12月16日,首期沙龙“海量实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。...您也可以在腾讯织云公众号下载本次演讲PPT。 背景 腾讯社交业务包括QQ、QQ空间、QQ相册等核心业务。核心业务按深圳、天津和上海三地分布,各支撑华南、华中、华东、华北、西北、西南等大区的用户访问。...一个SET内几十个模块,几百台服务器可在10分钟内完成自动化部署上线 。 SET的监控 针对SET内不同的业务架构,业务形态,我们也开发了配套的监控工具。...[图片] [图片] 相关文章 腾讯干货沙龙-海量实践大曝光 (一) 腾讯干货沙龙-海量实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

8.3K10

腾讯干货沙龙-海量实践大曝光 (一)

作者丨郭智文:腾讯高级工程师,手机QQ负责人。...12月16日,首期沙龙“海量实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。...业务同事通过腾讯网络中心联系到重庆联通网络负责人,经过多轮沟之后,确认确实是运营商在凌晨时段割接网络引起,运营商与厂商经过两次调整最后故障才得以解决。...总结 相关文章 腾讯干货沙龙-海量实践大曝光 (二) 腾讯干货沙龙-海量实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com

4.9K30

腾讯网络平台建设之路

本文是腾讯专家工程师陈政产老师在腾讯开发者社区技术沙龙深圳站的分享整理,为大家详细介绍腾讯网络平台的建设。 点击视频查看完整分享回放 一、腾讯网络介绍 ?...二、腾讯网络平台建设 1. 混沌工程 依上文所述,我们因为想要在网络故障前解决网络隐患,从而引入了混沌工程。那么混沌工程是怎么做的,它又是怎么在腾讯网络上落地的呢?...此外演习对于人员也是一个考验,对大家的应急反应能力要求很高。另一个主要区别在于输入,测试一般是来做一些功能印证,输入和输出通常都是可以预知的,而混沌工程更多是一种意外事件的引入。...三、腾讯网络平台未来思考 如上文所述,在网络排障方面,我们针对网络隐患采用了混沌工程的实验;对于网络变更,我们引入了变更体检;在网络监控方面我们已经比较全面和准确的覆盖了现网问题。...比如这个应用没有做好灾备就故障了,事后我要去排查为什么会故障,要去解决这个问题,但是我又想把这个场景复现一下,需要团队协助吗?

5.9K22

管理与自动化

4.4 监控自动化从《系统监控体系》中我们知道监控对象分为从多个维度,每个维度可能用到的工具不一样,即监控自动化可能需要对接不同的工具。...6.2 选择正确的阶段自动化一般沿袭这样的阶段:手动支撑 => 线上标准规范化 => 工具化 => 平台自助化/自动化。选择适合自己当前业务发展阶段的自动化方式,不要一口吃成胖子。...7.2 管理文章开头说管理主要目标是标准化/规范化,自动化,可视化/web化,从切身体验来看管理的目标也是随着自动化阶段的不同而变化的。...理由:(1)自动化的价值在于,将从繁琐的、例行、容易发生人为事故的工作中脱离出来,做更有价值的业务维和服务。所以,从这个角度来看,自动化既不是起点,也不是终点。...参考:1.高效自动化之殇https://yq.aliyun.com/articles/544292.腾讯最赚钱的部门是怎么做的?

49660

从零搭建一个自动化体系

通过自动化体系来实现标准化和提高工程效率,是唯一正确的选择。那么如何建设自动化体系呢?...一、建设自动化体系的原因 先来看一下我们为什么要建设一个自动化体系。首先来看遇到的一些挑战,如下图所示。 ? 维面对的挑战 第一个是游戏的需求。...二、建设自动化体系的目标 再看一下建设这套自动化体系的目标,也就是说我们的原则是什么?笔者将自动化体系的建设目标总结为四个词。 第一个是“完备”,这个系统要能涵盖所有的需求。...三、自动化体系的结构和运作方式 下图所示是我司当前自动化体系的几个子系统,我们来看一看它们是怎样联合起来工作的。首先服务器会经由自动化安装系统完成安装,然后会被自动化平台接管。...,形成完整的自动化体系

1.6K30

腾讯出品】自动化新玩法——标准企业应用案例分享

标准是一套通过成熟稳定的任务调度引擎,把多系统间的工作整合到一个流程,助力实现跨系统调度自动化的SaaS。...作为蓝鲸体系中兼顾操作和流程的标准化、自动化的利器,标准通过几大功能点去实现它的价值: 1、调度编排服务:基于蓝鲸PaaS平台的API网关服务,不仅集成了腾讯蓝鲸产品各大原子平台的能力;而且能够无侵入地对接企业内部已有系统的功能...[在这里插入图片描述] 【结语】对于游戏的更新,不同的企业会有不同的执行标准,任何企业都可以根据自身的需求,结合标准产品的灵活性,制定一套满足企业标准的自动化流程,即可带来明显的效益。...),具有如下特点: 规范标准的安装包,降低技术管理风险;(统一企业标准,便于管理) 端到端的流程编排,实现多种复杂流程编排;(编排流程,顺序执行) 全自动化的操作执行,提高软件交付效率;(自动化,节省成本...蓝鲸智简介 腾讯蓝鲸智(简称蓝鲸)软件体系是一套基于PaaS的技术解决方案,致力于打造行业领先的一站式自动化平台。目前已经推出社区版、企业版,欢迎体验。

57930

知识体系总结

知识体系 基础设施层 公有,私有(OpenStack/cloudstack + KVM/XEN,oVirt), 混合 服务监控 配置管理 硬件选型、配件更换、资产录入、系统安装(Cobbler...:数据库监控 自动化/DevOps:数据库平台 计算:数据库-RDS, Mongodb, Redis, Memcached, OceanBase 大数据----Hadoop生态圈(HDFS、Hive...移动推送、各类SDK(监控SDK、推流SDK等) 监控体系:舆论监控,外部网络监控,APM 自动化/DevOps:基于开放API开发 计算:DNS服务,CDN服务,移动服务,产品化 项目管理...监控平台 CI/CD系统 管理产品 管理体系 ITSM ITIL V3 IT Service CMM Six Sigma DevOps Master 项目管理(PMBok) 知识体系...as a Service 咨询 托管 技术培训 应急处理 产品即服务 DevOps专家服务 参考: 知识体系

35520

浅谈工具体系

行业正在变革,推荐阅读:30万年薪Linux工程师成长魔法 流程管理工具 发布变更流程管理工具:做为系统接口与其他角色的工作衔接。并提供审批环节控制发布变更的风险。...资源管理和隔离工具:以xen/kvm为代表的工具让可以更灵活的切割资源。比如虚拟机的快速起停,ip在idc内的漂移等。以 lxc/docker 为代表的工具让可以进一步的切割资源到进程级别。...监控告警工具 采集工具:一般是采集日志文件,也可以是定时轮询 DB 或者其他系统的接口。流行的开源方案是 logstash。 收集工具:采集工具上报给收集工具。...事件数据库:记录所有的告警。包括从其他系统获得告警,以及对现网的所有变更操作记录。这些数据用于支撑告警的原因定位。...告警自动修复工具:接受告警进行自动化的处理。帮完成固定的故障机下架退库等操作。或者在业务本身没有做高可用的情况下,做故障机替换,ip漂移等现网修复操作,一定程度地提高业务可用性。

1.4K80

自动化发展概括

1、自动化发展 学习和发展的一个线路: 1.搭建服务(部署并运行起来) 2.用好服务(监控、管理、优化) 3.自动化(服务直接的关联和协同工作) 4.产品设计(如何设计一个维系统)...-----当下计算的核心竞争力是!...系统架构师(偏管理):网络 系统 数据库 开发 计算 自动化 管理 服务管理 项目管理 测试 业务 -----专注于某一领域 2、自动化发展 工作内容分类: 监控(7x24...、巡检、报修、硬件监控) 3、自动化发展 标准化: 物理设备层面: 1.服务器标签化、设备负责人、设备采购详情、设备摆放标准 2.网络划分、远程控制卡、网卡端口 3.服务器机型、硬盘...自动化发展 基于ITIL的管理体系 成为一名经理: 技术: 知识体系 除了技术: 1.服务管理 ITIL 2.项目管理 PMP 做人

4.9K51

原生时代数据库体系演进

一、原生时代数据库挑战图片1.1 数据库体系演进从数据库体系的演进历程来看,1、2000年左右,PC互联网时代兴起,商业数据库是市场主流,而开源数据库方兴未艾。...在数据库领域,则自然衍生出了计算的一个分支概念,DaaS,data as a service,数据库的方式因此由人工脚本方式转变为了数据库平台的方式。...微服务架构,资源弹性,容器等原生技术广为传播。数据库的稳定性方面,因为开源数据库的高可用体系普遍成熟而大大缓解。数据库规模方面,实例数量和品类都进一步大增。...1.2 原生时代挑战这样的时代背景下,我以为数据库主要有三个方面的挑战:原生时代应用架构普遍微服务化,一个系统拆成多个微服务,这个系统的数据库也分拆成多个。...阶段二:在阶段一基础上引入AI判断,形成AI判断为辅,专家经验为主的故障处理体系。阶段三:构建AI判断为主,专家经验为辅的自愈系统,进一步提升自动化程度。

1.6K40
领券