首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯云网络运维平台建设之路

本文是腾讯云专家工程师陈政产老师在腾讯云开发者社区技术沙龙深圳站的分享整理,为大家详细介绍腾讯云网络运维平台的建设。 点击视频查看完整分享回放 一、腾讯云网络介绍 ?...二、腾讯云网络运维平台建设 1. 混沌工程 依上文所述,我们因为想要在网络故障前解决网络隐患,从而引入了混沌工程。那么混沌工程是怎么做的,它又是怎么在腾讯云网络上落地的呢?...此外演习对于运维人员也是一个考验,对大家的应急反应能力要求很高。另一个主要区别在于输入,测试一般是来做一些功能印证,输入和输出通常都是可以预知的,而混沌工程更多是一种意外事件的引入。...三、腾讯云网络运维平台未来思考 如上文所述,在网络排障方面,我们针对网络隐患采用了混沌工程的实验;对于网络变更,我们引入了变更体检;在网络监控方面我们已经比较全面和准确的覆盖了现网问题。...比如这个应用没有做好灾备就故障了,事后我要去排查为什么会故障,要去解决这个问题,但是我又想把这个场景复现一下,需要运维团队协助吗?

6.1K22

腾讯云林晓斌:腾讯云数据库运维进入智能时代

腾讯云数据库运维已进入了智能时代,当下的关键词是业务价值,云数据库和智能诊断工具会使DBA对业务价值的贡献凸显得更加纯粹。...据林晓斌介绍,历经数十年发展,数据库运维已经度过石器时代、工具时代、专家时代,随着工具的日趋成熟,低价值的工作量得以解放,DBA价值不断提升,数据库运维进入了智能时代。...此前,腾讯云发布的数据库智能管家 DBbrain,这是腾讯云结合前沿人工智能技术推出的一款数据库智能诊断和优化产品。...除了7*24小时的实时诊断优化,DBbrain还具有安全威胁识别、混合云管理数据库和掌上数据库运维等功能。...另外,腾讯云还联合微信团队将DBbrain的监控、异常诊断、优化建议以及数据库管理功能集中在了移动端,运维通过手机便可直接完成。

3.6K00
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    腾讯云数据库智能化海量运维的建设与实践

    作者介绍:鲁越,腾讯云数据库架构师团队负责人,主要负责腾讯云数据库MySQL、Redis、Oracle等数据库售前架构、运维、调优等工作,曾就职于网易和尼比鲁。...腾讯云数据库海量运维的经验,主要分为以下三部分: 1.数据库架构师团队的组建 2.自动化运维平台的建设 3.智能海量运维的实践 数据库架构师团队的组建 1组建缘由 由于数据库产品的特殊性和复杂性,我们在平时服务客户的过程中常遇到一些问题...自动化运维平台的建设 要更好地服务客户、提高服务质量,光有数据库架构师团队和售后服务体系是不够的,我们还要有一个非常稳定的自动化运维平台来支持环境。...智能海量运维的实践 经过实践和思考,发现在海量数据运维中,我们的自动化运维平台还不能解决以下这些问题: ·定制化服务。...腾讯云数据库海量运维之道-鲁越(1).pptx 更多前沿数据库技术和案例分享,请关注我们的微信号:腾讯云数据库CDB 腾讯云数据库公众号文章版.jpg

    3.2K371

    张戎:腾讯云智能运维(AIOps)项目实践

    11月9日,腾讯云开发者社区技术沙龙“高效智能运维”圆满落幕。...本期沙龙围绕运维展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务运维的技术实践干货,同时带来腾讯海量业务自研上云实践,推动传统运维向云运维转型...下面是张戎老师关于机器学习算法在时间序列的异常检测,故障的根因分析,时间序列预测方面的应用的内容分享。 讲师介绍:张戎,腾讯云高级研究员,新加坡国立大学数学博士,毕业后加入腾讯从事机器学习相关工作。...目前主要致力于智能运维方向的研究,包括时间序列异常检测,时间序列预测,根因分析,告警收敛等方向。 幻灯片3.PNG 今天讲的内容主要是智能运维方面的一些应用和实践。...这样过程中,我们整个智能运维就是将机器学习运用到运维领域,提升整个运维的质量、效率、成本三方面。 智能运维这一块一般来说会形成一个智能运维的学件库。

    4.3K54

    腾讯织云Metis智能运维学件平台正式开源

    10月20日,腾讯织云 Metis 智能运维学件平台正式对外开源。...1、项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...5、Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践

    5.3K21

    【开源公告】腾讯织云Metis智能运维学件平台正式开源

    1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis (点击文末阅读原文直接访问) 请给 Metis

    3.7K30

    【开源公告】腾讯织云Metis智能运维学件平台正式开源

    1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis 请给 Metis 一个 Star !

    1.4K30

    【开源公告】腾讯织云Metis智能运维学件平台正式开源

    1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis 请给 Metis 一个 Star !

    3.3K20

    揭秘腾讯云Supermind智能网络,百万级设备的网络高效运维

    超大规模网络运维的智能化 超大规模的网络数据采集、存储和实时计算已成为网络运维的极大挑战,腾讯云上网络线路几万条,拓扑复杂,但又需要满足多租户海量应用低时延、高吞吐的要求,使用人工评估加传统的路径规划算法的方式已无法根据链路负载的给出实时流量调度...如何实现超大规模网络运维的智能化?...全覆盖、多维、实时采集必然会造成数据大爆炸,大数据处理对腾讯云网络运维来说仅是基本功,腾讯云这身基本功,是依托15年的网络运营经验精打细磨出来的。...一般问题自动处理,重大故障专业建议 随着用云量和计算量成指数级增长,腾讯云面临的是海量的运维数据和极其复杂的云上网络运维场景,机器学习算法与云端网络运维业务整合是必然趋势。...、声纹获取利益,应对如此严峻的安全形势,腾讯云推出AI和大数据为驱动力,以云为平台和管道构建新一代智能安全防御体系,包括利用大规模图挖掘与机器学习追踪恶意团伙;通过人群画像与DNA建模,应对羊毛党与欺诈

    3.8K32

    腾讯数据库专家雷海林分享智能运维架构

    2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...image.png 关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。...扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...搜索关注腾讯云数据库官方微信,获取更多数据库技术干货分享,体验移动端一键管理数据库。...关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。 image.png

    11.9K20

    腾讯数据库专家雷海林分享智能运维架构

    2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。 ?...一、扁鹊的基本介绍 扁鹊系统是TDSQL面向云市场推出的一款针对数据库性能/故障等问题的自动化分析并为用户提供优化/解决方案的产品。 1....扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。 1....从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换

    1.9K20

    腾讯数据库专家雷海林分享智能运维架构

    2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...雷海林在大会现场 一、扁鹊的基本介绍 扁鹊系统是TDSQL面向云市场推出的一款针对数据库性能/故障等问题的自动化分析并为用户提供优化/解决方案的产品。 1....扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。 1....从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换

    1.4K60

    腾讯蓝鲸智云运维平台单机版本部署实践

    【腾讯】蓝鲸智云运维平台单机版本部署实践 【蓝鲸智云社区版】是腾讯对外开放的一套支持私有化部署、永久免费的运维解决方案。...该版本包含CMDB管理、作业脚本执行、流程编排、日志检索、监控告警、 故障自愈、微服务容器管理以及持续集成(CI)等能力,助力企业技术人员快速构建一体化运维支撑以及研发效能提升的能力,推动企业数字化转型...https://bk.tencent.com/docs/document/6.0/127/7543 2、磁盘分区准备 建议单独准备一块大于100G的磁盘用于/data分区 例如sdb盘,并使用LVM...的方式挂载到/data目录 fdisk /dev/sdb #全盘只分一个区 lsblk pvcreate /dev/sdb1 vgcreate vg_data /dev/sdb1 lvcreate -l.../install_minibk -y (图片可点击放大查看) 安装过程中遇到失败的情况,请先定位排查解决后,再重新运行失败时的安装指令。

    6.3K61

    基于腾讯云平台之自动化运维工具Ansible实践

    本篇将主要描述在腾讯云平台如何构建Ansible自动化运维管理工具平台/环境,如何批量管理云上服务器,批量分发配置等设置,同时这里将引入某客户真实的案例进行整体的阐述。...主流自动化运维管理工具Puppet:基于Ruby开发,采用C/S架构,扩展性强,基于SSL认证SaltStack:基于Python开发,采用C/S架构,相对于puppet更轻量级,配置语法采用YMAL,...Ansible环境部署这里为了更直观看到效果,采用3台centos7.6 + 1台ubuntu进行自动运维环境的构建,如果需要覆盖更多被管主机,则通过下面的方法扩展即可。2.1....案例说明近期某客户基于腾讯云镜(主机安全)进行等保安全基线扫描,发现有上百台云服务器的安全基线不符合客户安全部门的安全需求,需要进行整改,涉及的机器量也比较大,而客户侧人员较少,日常运维常用采用简单脚本方式进行云上运维管理...一开始比较倾向云上的产品进行批量或自动修复,发现比较难找到合适的产品完全吻合,因此这里推荐采用Ansible自动化运维的方式进行批量修复云服务器的安全隐患问题,这里简单列举几项高危风险示例: 序号风险项威胁等级描述处理建议

    2.5K170

    腾讯智维平台在渝上线,开启IDC智能运维新时代

    作为腾讯20年数据中心运维经验的结晶,腾讯智维平台将以水土机房为起点,逐步在重庆电信机房部署落地。此次合作,正是腾讯数据中心为行业升级提供解决方案的一次尝试,也代表着腾讯拥抱产业互联网的决心。...图4    腾讯重庆云计算数据中心 腾讯智维由服务内部的星云平台升级而来,是腾讯自研的数据中心技术设施管理软件平台。...通过智维平台,可以实现数据中心的智能告警、智能巡检、智能容量分析和透明化的客户体验,为全局把控、精细化管理、优化运营成本提供基础,同时也为技术专家实时、异地处理告警,数据中心无人值守创造可能。...图5    腾讯智维平台优势介绍 接入腾讯智维平台后,重庆电信数据中心将在运营方面更加智能化和可视化,如同多了一双可以掌控数据中心运营全局的“眼睛”。...“扎根消费者互联网、积极拥抱产业互联网”,借由智维平台,腾讯可将在服务C端海量用户时积累的经验,转化为服务B端合作伙伴的坚实基础。

    2.3K10

    腾讯智维平台在渝上线,开启IDC智能运维新时代

    作为腾讯20年数据中心运维经验的结晶,腾讯智维平台将以水土机房为起点,逐步在重庆电信机房部署落地。此次合作,正是腾讯数据中心为行业升级提供解决方案的一次尝试,也代表着腾讯拥抱产业互联网的决心。...图4    腾讯重庆云计算数据中心 腾讯智维由服务内部的星云平台升级而来,是腾讯自研的数据中心技术设施管理软件平台。...通过智维平台,可以实现数据中心的智能告警、智能巡检、智能容量分析和透明化的客户体验,为全局把控、精细化管理、优化运营成本提供基础,同时也为技术专家实时、异地处理告警,数据中心无人值守创造可能。...图5    腾讯智维平台优势介绍 接入腾讯智维平台后,重庆电信数据中心将在运营方面更加智能化和可视化,如同多了一双可以掌控数据中心运营全局的“眼睛”。...“扎根消费者互联网、积极拥抱产业互联网”,借由智维平台,腾讯可将在服务C端海量用户时积累的经验,转化为服务B端合作伙伴的坚实基础。

    2.5K10

    如果云主机太多,运维管理麻烦的话,了解下我们的运维平台

    企业一体化运维管控平台 xabcloud.com 小矩阵一体化运维平台解决企业云上或者自建数据中心大量主机高效安全运维管控的问题,支持多个独立网络节点主机管理,即支持多云统一管控 随着云计算整体技术的发展...,必然出现与时俱进的企业运维解决方案,经常有工程师询问小矩阵运维平台的一些细节功能,以下回答关于平台的若干问题 统一管控 Central可以管控异地多网络节点的Master和Login,进而对各Master...节点所属的Minion机器统一管控 高度安全 六重安全策略并行(内置企业堡垒机模块) 废弃传统密码认证登录,全可信认证登录,彻底解除云上主机暴力破解的安全风险问题 全线主机 RSA key pairs...无感知动态更替 权限管理 生产机器登录权限自助式申请,管理员审批 权限到期提醒,过期清理 管理员可以赋予多个运维角色,日常审批权限,部署,协同管理 云堡垒机 登录跳板机会提示有权限的业务机器列表,过期时间...,登录次数,公告广播等关键信息 实时监控 以应用组为维度,机房总览,实时监控,历史监控,报警阀值 报警信息打通企业微信 Web平台全终端适配,业务系统的运行情况了如指掌 模版部署 如JAVA,Nginx

    2.1K20

    金融云原生漫谈(七)|云原生时代:从传统运维到智能运维的进阶之路

    本期金融云原生漫谈,将和您共同探索,云原生时代智能运维的进阶之路。 随着金融业务的快速发展,支撑业务的IT基础设施的变化节奏也大大加快。...在监控这个领域,除了目前比较热门的纯软件层全链路监控以及混沌工程,建议应该结合硬件的监控和检测实现端到端的监控和测试,以提升平台的稳定性和效能。 为什么说基于K8s的容器是实现智能运维的必然选择?...容器的智能运维有无成功实践案例?...搭建云原生运维体系非一蹴而就,需要循序渐进,在安全可控的基础上逐步扩展。在技术层面,合适的云原生技术平台可以帮助企业释放运维的巨大压力,并保证安全稳定。...我们相信,在数字化转型的大背景下,减少人力参与的智能运维势必会成为未来IT运维的发展方向。我们也期待着能够帮助更多企业实现云原生时代的智能运维进阶。

    74130

    运维:跨平台非常好用的压缩软件PeaZip介绍

    在阅读这篇文章前,推荐一篇“好”文章:鸿蒙应用开发实践 这篇文章给大家分析了目前国内最火的技术鸿蒙系统开发相关的知识,该文章把鸿蒙应用开发通过15个步骤进行梳理,对于入门鸿蒙开发的朋友来说还是非常有参考意义的...它不仅适用于 Windows 操作系统,同样支持 Linux 和 macOS,为用户提供了一个跨平台的文件管理解决方案。...2.3 强大的加密功能与文件哈希 为了保证文件的安全性,PeaZip 提供了多种加密算法,允许用户通过设置密码来保护自己的文件免受未经授权的访问。...更重要的是,PeaZip 允许用户在不解压的情况下查看压缩文件中的内容,极大地提升了用户体验。...此外,PeaZip 还能够与电子邮件客户端及云存储服务(如 Dropbox、Google Drive)无缝集成,使文件分享和备份变得更加方便。

    16120

    数据库管理与运维难不难?腾讯云数据库给你答案

    3月30日第一期分享会“数据库管理与运维”专场已结束,本期带来各讲师分享精华及直播回顾视频。想要讲师ppt的小伙伴,可在腾讯云数据库公众号后台发送"3.30讲师课件",即可获得讲师课件哦!...数据库智能调参能力解析及最佳实践 ——程昌明,腾讯云数据库高级产品经理 深度学习这个词已经进入公众的视线,时至今日,相关技术也比较成熟,腾讯云数据库团队也在思考如何借助深度学习的方式来提升数据库的运行效率...数据库统一纳管平台DBhouse技术路线 最佳实践 —— 陈昊,腾讯云数据库产品经理 随着业务互联网化发展,越来越多的业务应用选择使用分布式数据库解决方案,数据库的数量在急剧增长。...简言之,DBhouse是数据库统一纳管平台,帮助企业实现数据库运维自动化、自助化和流程化。功能如下: 监控能力。我们会去做一些数据库探活,包括数据采集,采集完的数据会定义告警。...﹀ ﹀ ﹀ -- 更多精彩 -- 数据库纳管平台DBhouse的技术路线与实践 快上车!数据库智能自治时代已到来,腾讯云数据库 X AI 取得新突破 ↓↓点击阅读原文,了解更多优惠

    1.2K42
    领券