首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

运维平台体系,你们真的有好好规划吗?

技术运营数据和产品数据的一个很大的区别是,前者在数据挖掘方面的能力要求很少。这个地方有个建议,把线上服务的数据驱动作为重点(80%),把运维内部服务的数据驱动为辅(20%)。...因为线上服务的状态会反作用于运维内部事务的优化。比如说从数据中发现现网的服务有一个故障,需要紧急发布版本,此时就会直接检验运维的变更部署流程、平台的完备性。...这个视角和传统模式有些不同,主要是公有云的存在。...这块对运维的质量、效率、能力等影响最大,在之前的文章“如何化解研发和产品之间的矛盾”中重点阐述过服务公共化是唯一的解决之道。...作者简介 王津银 07年进入腾讯公司接触运维,先后在YY和UC参与不同业务形态的运维,对运维有一些理解。

2.2K01

有运维专家推荐吗?

因为工作行业的原因,会有很多的同行或朋友找我推荐一些有运维经验的人,或者直接希望要运维专家。 最近我回顾了下这个事情,发现很奇怪的是,好像我一次都没有推荐成功过。...我琢磨了下,可能有这样几个原因: 第一个,运维范畴,就运维这个工种来说,其实也是有很大范畴的,比如IDC运维、主机运维、系统运维、网络运维、应用运维、运维开发、智能运维等等。...特别是应用运维这个层面,无论是开发,测试还是运维本身,我认为都要具备一些运维能力,比如: 对于分布式架构,如DB、缓存、消息、服务化框架,这些从建设一开始,就要考虑端到端的产品建设,要考虑如何能够让业务开发自助使用...但是这种能力的承载,或者说对开发的运维能力的赋能,将成为运维这个角色的职责,需要能够有统一的基础平台建设提供支撑,所以我们会发现,当前我们更加需要能够帮助团队建设出高效运维体系的角色,而不再是能够被动响应更多问题的角色...再往后,就需要对基础设施和基础服务有规划的建设,这个要求应该是提给系统架构师和业务架构师的,而不是提给运维角色。前面基础打不好,后面想让运维做好,这个没可能。

1.9K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    VMware云管平台运维管理

    摘要 跨 SDDC 和多云环境从应用到基础架构的智能 IT 运维管理。...其中有三大块内容,一个是自动化部署的vRA,一个是做智能运维的vR Ops,以及做成本分析的vRB,这三块共同支撑起了云管平台。 这期我们重点来介绍vR Ops。...vRealize Operations——云运维智能化 在整个平台中,vRealize Operations实现了性能的管理、容量管理、成本管理、配置管理以及合规性管理。...SDDC-应用-运维-视图及针对每个产品的健康分类;SDDC-应用-组件关联到底层基础设施的健康状态(部署实例及虚机健康一致性);增强的开箱即用;健康和合规,报警与改进建议。...使用vRA,利用运维分析优化工作负载的初始部署位置。 应用案例及常用使用场景 云平台特点 负载动态变迁,运行环境不固定,状态难以跟踪。 配置变化更快,资产生命周期短,统计分析难。

    8.3K50

    运维的未来:云服务兴起,运维人员会“下岗”吗?

    传统的运维( Ops)没有消失,只是在重组。 云服务的发展看起来让运维人员“丢”了工作,因为从传统意义上说,从本地(on-premise)转移到云平台意味着运维工作在相当大程度上外包给云提供商。...其实新运维模式本质上应该把运维看作是一个产品团队,其产品就是基础设施。...@perterbourgon 关于这个话题,我有很多想法,tweet 版本是:我们所知道的 ops 已亡,做基础设施的人有五年的时间转移到产品上。...在集成环境中,使开发者团队能够 SSH 登录进 box 中或者将调试器附加到集合上,会阻止他们正确地调试应用程序吗?会促进痛苦移位吗?在运维思维和开发思维间取得平衡是非常必要的。...随着运维工作转移到云,它需要给予开发团队更多的权利和信任以重塑自身,而不是“闭关锁国”。 运维长存! 【本文转自 36氪 】

    3K40

    腾讯云网络运维平台建设之路

    导语 | 腾讯云网络作为云的基础设施,其质量和稳定性直接影响了云的运营质量和用户口碑。同时客户对基础设施依赖度高,故障容忍度低,云网络产品迭代更新快,决定了我们需要对云网络质量有更高的要求。...本文是腾讯云专家工程师陈政产老师在腾讯云开发者社区技术沙龙深圳站的分享整理,为大家详细介绍腾讯云网络运维平台的建设。 点击视频查看完整分享回放 一、腾讯云网络介绍 ?...二、腾讯云网络运维平台建设 1. 混沌工程 依上文所述,我们因为想要在网络故障前解决网络隐患,从而引入了混沌工程。那么混沌工程是怎么做的,它又是怎么在腾讯云网络上落地的呢?...三、腾讯云网络运维平台未来思考 如上文所述,在网络排障方面,我们针对网络隐患采用了混沌工程的实验;对于网络变更,我们引入了变更体检;在网络监控方面我们已经比较全面和准确的覆盖了现网问题。...比如这个应用没有做好灾备就故障了,事后我要去排查为什么会故障,要去解决这个问题,但是我又想把这个场景复现一下,需要运维团队协助吗?

    6.1K22

    十二月——没有寒冬,只有开始

    本届TOP 100 Summit案例来自互联网公司、电商企业、智能硬件企业、互联网金融公司等各个领域的技术研发团队,案例议题设计产品创新、互联网转型、团队敏捷提升、大数据、架构设计、自动化运维、质量管理等热点议题...好雨云CEO 刘凡将分享《好雨云使用OKRs做绩效管理》 案例简述 绩效管理的作用是实现公司目标完成、团队效能提升,然而传统的绩效管理方法(MBO,BSC,KPI)有一些问题,如:不利于团队的协作和成长...此次盛典为期一天,设置五个分会场,涵盖容器、移动开发、数据库存储、运维、其他综合各类开发技术,大会将邀请行业内各路精英,一起跟大家探讨他们的深入研究和见解,碰撞技术的火花。...【12.12-12.30 】2015·感恩极客开发者资源优惠反馈活动 好雨云携手国内优秀的企业级服务厂商连续三周为创业公司提供福利。...帮助创业者们度过寒冬,无论从基础的云服务,还是开发工具平台,又或者是企业应用软件,都将全面优惠回馈,优惠力度史上最低!

    22.4K40

    如果云主机太多,运维管理麻烦的话,了解下我们的运维平台

    企业一体化运维管控平台 xabcloud.com 小矩阵一体化运维平台解决企业云上或者自建数据中心大量主机高效安全运维管控的问题,支持多个独立网络节点主机管理,即支持多云统一管控 随着云计算整体技术的发展...,必然出现与时俱进的企业运维解决方案,经常有工程师询问小矩阵运维平台的一些细节功能,以下回答关于平台的若干问题 统一管控 Central可以管控异地多网络节点的Master和Login,进而对各Master...节点所属的Minion机器统一管控 高度安全 六重安全策略并行(内置企业堡垒机模块) 废弃传统密码认证登录,全可信认证登录,彻底解除云上主机暴力破解的安全风险问题 全线主机 RSA key pairs...无感知动态更替 权限管理 生产机器登录权限自助式申请,管理员审批 权限到期提醒,过期清理 管理员可以赋予多个运维角色,日常审批权限,部署,协同管理 云堡垒机 登录跳板机会提示有权限的业务机器列表,过期时间...,登录次数,公告广播等关键信息 实时监控 以应用组为维度,机房总览,实时监控,历史监控,报警阀值 报警信息打通企业微信 Web平台全终端适配,业务系统的运行情况了如指掌 模版部署 如JAVA,Nginx

    2.1K20

    平台工程和ChatGPT会让运维们失业吗?

    作者 | 李倩 & 杨振涛   如今,在 Kubernetes 上构建应用程序的开发人员,不仅要写代码还要负责交付和运维等。...因为开发团队希望快速交付产品,而运维团队希望确保应用程序的稳定性和安全性。这种博弈不仅存在于 DevOps,还涉及到其他角色,例如开发、测试、运维、安全、IT、财务等。...我们需要思考如何在开发、测试、部署和运维等环节中建立多方合作的机制,以实现整个价值链上的协同效应。...有些称之为 DevOps、SRE 等,还有其他各种称谓,如业务运维、系统运维、基础运维等。职责划分经常调整,公司的组织结构也在变化,总是不断合并和分裂,进行组织重构。...在不同公司中,这些职位的名称也不尽相同,如 SRE、运维、云原生工程师等等。 无论是 DevOps 工程师、SRE 工程师还是平台工程师,他们都可能在做类似的工作。

    36430

    让云管平台插上自动运维的翅膀!

    比较而言,各个厂商的云管平台的自动化运维能力,相对与资源管理要弱,因此很多用户要在云管平台之外,单独搭建运维平台。造成的结果是:很多用户云管平台和运维平台相分离。...那么,针对红帽的云管平台CloudForms,我们如何在保持其资源管理优势的基础上,让他插上自动运维的翅膀,从而形成资源管理与运维管理一体化的平台呢?...通过将Ansible Tower与CloudForms对接的方式,将Ansible Tower常见的运维操作通过云管平台的服务目录发布,让IT运维人员繁杂而枯燥的运维工作,变成轻松而愉快的“网购”体验,...通过Ansible Tower与CloudForm对接,可以将用户的自动化运维任务服务目录化,并对接用户数据中心审批流程,从而推动用户云管平台和自动化运维平台的集中化管理、推动数据中心的规范化管理,使用户的...没错,正是Ansible Tower,让云平台CloudForms插上自动运维的翅膀!

    2.2K40

    运维经验沉淀,面向云原生的一站式日志采集配置及运维平台

    ◆ 一、开源项目简介 滴滴LogiAM来源于滴滴多年来大量的运维实践经验。经历过多方考验,对于大规模Agent日志采集治理管控及巡检诊断已经沉淀出一套完善的解决方案。...在云原生时代背景下,LogiAM以“应用/服务”为采集粒度,满足了从业务层面创建采集任务的需求。...高效的问题诊断、定位能力:具有卓越的指标诊断体系,将Agent、日志采集任务运行时状态全景数字化呈现,实时监控Agent及采集任务健康度,提供故障诊断功能并开具相应诊断报告,可高效快捷的实现问题定位 强大的运维能力...:基于滴滴多年各核心业务、海量Agent与采集任务的运维经验,对于超大规模Agent与采集任务的治理管控及巡检诊断已经沉淀出一套完善的解决方案。...实时查看运维任务,便于运维人员把控运维任务进度及状态 ◆ 五、技术选型 ◆ 滴滴Logi-Agent架构图 ◆ Agent Manager 本地开发环境搭建 ◆ 1 环境准备 ◆ 1.1 环境依赖

    1.2K20

    干货 | 携程万台规模容器云平台运维管理实践

    作者简介 周昕毅,携程系统研发部云平台高级研发经理。现负责携程容器云平台运维,Cloud Storage及Cloud Network基础设施研发及运维。...2.6 关注趋势 前面讲的是关注变化,关注变化算是比较基础的一个工作,因为做运维的工程师都会关注我们是否有告警,平台是否有变化,而趋势往往会被工程师所忽视。...我们关注趋势可以设定长期目标,让运维工作比较有计划性,运维工作有计划性是非常重要的,怕就怕的是运维工程师每天都在处理突发的工作,没有时间对你管理的平台做前瞻性的规划,把事情做在前面,不要把压力留给自己。...所以我们现在也是在尝试做一些日志产品和监控产品,在云原生的 DevOps 工作方式。我们运维人还是要以用户至上的,整体出发点保证平台稳定、持续、高效运行。...展望团队工作的话,接下来会有混合云运维的实践,携程这些采购公有云的产品,阿里云、AWS还没有做很好的整合,下一步把混合云管理起来,真正做到云原生。

    2.8K31

    基于腾讯云平台之自动化运维工具Ansible实践

    本篇将主要描述在腾讯云平台如何构建Ansible自动化运维管理工具平台/环境,如何批量管理云上服务器,批量分发配置等设置,同时这里将引入某客户真实的案例进行整体的阐述。...主流自动化运维管理工具Puppet:基于Ruby开发,采用C/S架构,扩展性强,基于SSL认证SaltStack:基于Python开发,采用C/S架构,相对于puppet更轻量级,配置语法采用YMAL,...Ansible环境部署这里为了更直观看到效果,采用3台centos7.6 + 1台ubuntu进行自动运维环境的构建,如果需要覆盖更多被管主机,则通过下面的方法扩展即可。2.1....案例说明近期某客户基于腾讯云镜(主机安全)进行等保安全基线扫描,发现有上百台云服务器的安全基线不符合客户安全部门的安全需求,需要进行整改,涉及的机器量也比较大,而客户侧人员较少,日常运维常用采用简单脚本方式进行云上运维管理...一开始比较倾向云上的产品进行批量或自动修复,发现比较难找到合适的产品完全吻合,因此这里推荐采用Ansible自动化运维的方式进行批量修复云服务器的安全隐患问题,这里简单列举几项高危风险示例: 序号风险项威胁等级描述处理建议

    2.5K170

    数峦云数字孪生智慧校园三维可视化运维检测平台

    案例介绍: 2020年,数峦云科技参与浙江工商大学智慧校园信息化建设工程,根据学校自身业务模块需求,公司采用虚幻引擎开发,结合了物联网\GIS\BIM等数据,利用视频流云渲染BS架构部署方案,量“身”打造了数字孪生智慧校园三维可视化运维检测平台...,助力浙江工商大学的校园管理,旨在推动“智能+教育”的发展,为提供更加便捷、高效、直观的管理运维检测平台,提供更加智能、更加安全高效的校园环境。...image.png 优势 & 关键技术 数峦云数字孪生智慧校园三维可视化检测系统包括倾斜摄影、模型重建、环境仿真模拟、数据集成与分析、实时渲染、云渲染等技术步骤。...image.png 运维管理三维可视化 支持集中收集校园内各项设备的损坏情况并记录,直观显示待处理事件以及处理事件负责人,统计校园内全部设备的运维情况,有利于运维负责人及时维修各项设备,为学生提供更加完善的学习设备...image.png 总结 数字孪生技术正以洪水猛兽之势崛起,运用到的领域将非常广阔,智慧校园运维检测平台能够解决校园数据管理上的可视化“痛点”,帮助校园管理者打通各领域数据,消除数据孤岛,提升决策能力

    3.4K10

    爬虫系统云平台部署与维护:利用Docker和Kubernetes优化运维

    在云平台上部署和维护爬虫系统可以带来诸多好处,而利用Docker和Kubernetes进行运维优化则能进一步提升效率和可靠性。...本文将为您介绍如何在云平台上部署和维护爬虫系统,并利用Docker和Kubernetes进行运维优化的具体方案和实际操作建议。第一部分:构建爬虫系统云平台1....第三部分:Kubernetes优化爬虫系统运维1....第四部分:爬虫系统云平台运维与监控1. 健康检查和故障恢复: - 利用Kubernetes的健康检查和故障恢复机制,监控爬虫系统的健康状态,并在发生故障时自动重启或替换实例。2....在实际操作中,需要选择合适的云平台、构建合理的爬虫系统架构,利用Docker进行容器化部署,利用Kubernetes优化运维和监控。

    34940

    【运维自动化-配置平台】如何使用云资源同步功能(腾讯云为例)

    云资源同步是通过apikey去单向同步云上的主机资源和云区域信息,目前支持腾讯云和亚马逊云。...主要特性1、蓝鲸配置平台周期性的单向只读同步云主机和vpc(对应蓝鲸云区域)信息,第一次全量,后面增量2、默认同步到主机池,也可自定义主机池模块,需要手动分配到业务3、主机随云控制台销毁而从配置平台里删除掉实操演示以腾讯云...CVM自动同步为例1、新增云账户资源-云账户-新建如何获取ID和Key?...登录腾讯云控制台,账号信息-访问管理-访问密钥连通性测试OK即表明能正常通过apikey拉取,云账号创建成功。2、配置云资源同步任务云账号创建成功之后,需要配置云资源发现的任务,开启云资源同步。...(根据非直连区域agent安装指引,需要提前安装proxy)具体详细指引见:【节点管理】直连区和非直连区域的agent如何安装说明:适合产品版本 V6.1/V6.2/V7.0/V7.1

    22910

    新时代运维监控能力的进化——天网云用户体验监控平台实践

    作者简介:梁定安,腾讯社交平台业务运维负责人,技术运营通道评委,腾讯云布道师,腾讯课堂讲师。 前言 运维团队审视业务质量监控能力时,有九个问题值得思考: 您产品的服务质量监控是360度无死角的吗?...您的产品与竞品的差距有多少? 默默无闻的运维团队如何给业务传递技术运营的价值?...[1483955668711_6172_1483955668864.png] 用户体验监控平台弥补了常规技术手段难以发现的空缺,也是腾讯运维在构建立体化监控体系的一个新的成功尝试,在该平台持续的运营过程中...,我们还逐步完善了其他的监控能力,使其能更接近产品、开发、运维的监控需求,为业务输出更大的价值。...天网云-用户体验监控平台已经完成SaaS产品化的改造,可以在 腾讯云 上申请接入使用。 [1483955682956_6698_1483955683142.png]

    4.8K31

    【运维探讨】如何建设合理、可落地、持续发展的云管平台?

    ,并与云管产品建立必要的数据和运维流程的交互。...清晰定义云管项目或者产品与ITOM整体运维体系间关系 在建设云管项目时,除了云管自身功能,还需要将云管放到运维管理体系中统筹考虑,明确云管在运维系统中的位置,以及与ITOM中其他运维领域如何交互,如下所示...“大”平台+“小”云管:运维体系平台化+云管场景工具化构建方式 云管项目的建设本身建议采用运维体系平台化+云管场景工具化构建方式进行构建。...这样有多个好处: 运维平台为云管提供通用运维能力: 通用的运维管理能力统一沉淀到运维管理PaaS平台,为云管功能提供能力输出。...提升用户云服务使用效率 云管平台融入运维体系

    2.5K32

    运维天地-虚拟化01-云平台获取客户数据so easy

    B 运维易用性考量 自有数据中心运维考量 专业人才的匮乏+无技术积淀导致后期的规划不合理&无标准和故障频发。 共有云运维考量 底层无需考虑(公有云团队搞定),用户只关注上层应用即可。...IDC选型&运营|网络规划&建设|服务器规范&选型|CMDB设计合理都是衡量一个公司运维和故障率的因素。机器宕机找不到位置+交换机网口,找机器和网口浪费几个小时现象也很常见。 ? ? ?...云上数据的获取,从技术上非常简单;那么云上数据的安全就只能靠两个方面:a.法律法规的强制约束 b.云运营商的职业道德 本文从技术层面上给读者讲解:云平台管理员怎么获取客户虚拟机里的数据;当然”技术无罪...“,可以用到正常的运维故障处理,也可能被用到灰色地带。...假设我是云平台管理员,在无需虚拟机密码的情况下可以随意获取客户虚拟机里面的文件。以上只是简单演示,技术无罪。

    87120
    领券