云平台的相关资源经常变化,对资产的记录和更新往往不及时,影响资产盘点和日常运维工作,为此WeOpsV3.14版本新增云平台自动发现和纳管功能:
背景 腾讯云容器服务TKE从2016年提供服务至今,已服务成千上万企业构建其容器化平台, 一方面,腾讯云容器团队在提供容器服务时积累并完善了一套万级K8s集群的etcd管理平台,用于支撑腾讯云容器产品稳定运行,该平台同时也支撑了腾讯内部业务如云监控,api网关,欢乐游戏等,另一方面,我们积极参与etcd社区,将我们大规模实践过程中遇到的问题和解决方案,反馈和贡献给社区,是社区2020年最活跃的贡献团队之一。 容器团队在多次客户访谈中了解到,很多客户不想自己运维etcd,期望能够使用腾讯云容器服务内部et
作者:何金胜&张加浪,腾讯云云监控高级工程师 前言 知名游戏公司云资源使用了腾讯云、AWS 和自研 IDC,业务覆盖了国内和海外。云上资源包括了计算资源服务器、存储类的包括 MySQL、Redis、S3 等、大数据处理(EMR)以及网络资源等。业务服务主要通过 Golang与 PHP 语言开发,服务使用微服务框架,由多个游戏工作室共同开发完成。如此大的业务,如何实现高可用的一体化监控并降低云原生 Prometheus 的监控成本呢? 客户现状和痛点 经内部规划后,该游戏公司决定基于自建的 Prometh
2021年8月 VOL:16 腾小云告诉你最前线的产品新特性 总有一款让你心动~ 云说新品 容器产品新特性 8月上新 腾讯云边缘服务TKE@Edge 从中心云管理边缘云资源的容器系统 边缘容器服务(Tencent Kubernetes Engine for Edge,简称 TKE Edge)是腾讯云容器服务推出的用于从中心云管理边缘云资源的容器系统。 ServiceGroup功能增强:DeploymentGrid 支持查看和管理实例,支持对分布在不同地域的应用
日志服务(Cloud Log Service,下文简称CLS服务)是腾讯云提供的一站式日志数据解决方案,可以快速便捷的接入,享受日志采集、日志存储到日志内容搜索、统计分析等全方位稳定可靠的日志服务。下文讲解业务接入腾讯云日志服务方案。
认证链接 腾讯云CloudLite认证 云开发 CloudBase 产品认证 目录 在线学习 初识云开发 CloudBase 云开发基础之云函数 云开发基础之云存储 云开发基础之云数据库 云开发基础之云调用 云开发基础之静态托管 云开发基础之监控告警 动手实践 Web 云开发快速开始 Vue 云开发问卷实战 小程序·云开发实战——30分钟搭建个人相册小程序 证书展示 [证书] 知识点摘记 云开发cloudbase 云端一体化,多端应用的开发 聚焦业务逻辑,降低成本,开发提效 云开发cloudbase能力架构
随着微服务架构的逐渐流行,在熵增且庞杂的系统中准确的定位一个请求的完整生命周期,逐渐成为了研发同学面对的最大的痛点之一。以研发同学自测过程为例,开发同学往往希望在发起测试的 Http/RPC 请求后,能够通过一个简单的方式获取整个测试请求的上下文信息。这其中通常包括相关的上下游链路、各个服务内部请求的方法堆栈,以及链路上打印的日志等数据,对于指标-链路-日志的一体化监控的需求已经迫在眉睫。
本文主要介绍了如何基于监控告警实现业务闭环,从四个大方面进行了展开:1)基于业务影响的监控告警,2)基于故障收敛的监控告警,3)基于运维流程的监控告警,4)基于质量度量的监控告警。在本文中,作者还介绍了在腾讯云平台上如何利用监控数据实现故障定位和故障恢复,以及如何通过自动化流程实现故障收敛和故障自愈。
在云计算技术领域,“Serverless(无服务器)”作为一种新型的软件设计架构正在快速崛起。作为继虚拟机、容器后的第三代通用计算平台,Serverless技术也一直是腾讯云原生的重点发力领域。 11月6日,在由腾讯云主办的首届Techo开发者大会上,腾讯云宣布与全球最流行的Serverless开发平台Serverless.com达成战略合作,成为 Serverless.com的全球战略合作伙伴以及大中华区独家合作伙伴。 截至目前,Serverless.com拥有百万级别的活跃应用程序以及50000+的
在云计算技术领域,“Serverless(无服务器)”作为一种新型的软件设计架构正在快速崛起。作为继虚拟机、容器后的第三代通用计算平台,Serverless技术也一直是腾讯云原生的重点发力领域。
周三晚7点,直播间好礼送不停,即刻预约 针对业务指标波动特性,通过AI和大数据处理实现自动监控告警,本次直播将向大家详细剖析腾讯云云监控的智能监控--动态阈值的场景应用及优势。内部成熟系统已使用四年多,现特向对开放能力。 直播纲要 1. 业务心声(从我们自己开始) 2. 腾讯云智能监控技术方案 3. 腾讯云智能监控优势&典型场景 4. 探索中的思考 识别【二维码】或戳【阅读原文】预约直播
针对业务指标波动特性,通过AI和大数据处理实现自动监控告警,本次直播将向大家详细剖析腾讯云云监控的智能监控--动态阈值的场景应用及优势。内部成熟系统已使用四年多,现特向对开放能力。
随着研发的进展,我们线上系统逐步上线,如何确保我们线上服务的稳定运转,监控告警是非常重要的环节。监控告警是一个很大的话题,有多种模型来描述。本文仅讲述通过系统外部以黑盒的方式探测系统正常与否。腾讯云对于通用的问题,是能监控到并且通过邮件、电话的方式及时提醒。但我们系统内部业务和技术逻辑层面的问题,腾讯云是无法做到良好支持的。(比如,腾讯云可以很好的监控HTTP状态码非200的问题并报警,但我们基础设施正常,HTTP返回200,但HTTP响应的body中code不等于0,这种问题腾讯云是很难解决的)。
2021年1月 VOL:09 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ 云说新品 容器产品新特性 12月上新 腾讯云边缘服务TKE@Edge 从中心云管理边缘云资源的容器系统 边缘容器服务(Tencent Kubernetes Engine for Edge,简称 TKE Edge)是腾讯云容器服务推出的用于从中心云管理边缘云资源的容器系统。 边缘集群支持购买 CVM 节点。 创建边缘应用及工作负载,支持选择使用 TCR 镜像仓库。 边缘集群支持云监
yuhuliu,腾讯研发工程师,关注存储、大数据、云原生领域。 摘要 医疗资讯业务在高速发展过程中,形成了覆盖不同场景、不同用户、不同渠道的几十个业务,以及上千个服务。为了高效满足用户多样化的需求,腾讯医疗技术团队通过 TKE 上云,使用 Coding DevOps 平台,以及云上可观测技术,来提升研发效率、降低运营运维成本。本文介绍我们在上云过程中一些实践和经验,以及一些思考和选择。 业务背景 stage1: 腾讯医疗资讯平台主要包括了医典、医生、医药等核心业务,其中医典主要提供医疗相关内容获取、医疗知
在我们深入使用CLS 的过程中,CLS的性能和数据加工的简便性给我们留下了深刻印象。原来需要自建Kafka和Flink才能完成的需求现在CLS两分钟就可以搞定了!
作者:张加浪,腾讯云云监控高级工程师 前言 某电商客户的网站加速 30% ,调用成功率上升3%,实现了分钟级定位故障...... 某银行实现端到端的全链路覆盖和性能量化,解决了多处性能短板...... 在云原生时代,且业务架构复杂、用户量庞大的场景下,他们怎么都能轻而易举地实现了? 方案背景 自研业务上云、业务服务云化,底层 IAAS、PAAS 等资源托管依赖,业务聚焦于业务逻辑实现。使用微服务框架开发服务进行敏捷开发,服务模块化运作。资源依赖托管、业务微服务化这些使得服务研发、运营变得更符合云化,
腾讯云产品有很多的分类,一般有一级大类和二级分类,其中,日志服务CLS是作为大类“存储”中的“数据处理与分析”类别下。如果我们想体验CLS服务,可以从下图的这个入口进入,地址:传送门。
公众号现已支持通知主要包括:工单、备案、余额预警、安全事件、域名相关、监控告警相关通知,其他通知正在陆续上线中。
对于任何一个线上服务来说,可用性都是一个重要的质量指标,用户能否用产品完成任务?效率如何?主观感受怎样?这实际上是从用户角度所看到的产品质量,是产品竞争力的核心,是产品可靠性、维修性和维修保障性的综合反映。
2018世界杯鏖战正酣,在国内看直播的小伙伴想必也看得很过瘾,那么国内的小伙伴是如何收看到流畅、清晰的直播呢?腾讯视频云直播平台作为助力本次世界杯国内直播的重要PaaS平台,期待给大家带来优质的体验。
前言 变更是网络运营中最常见的工作之一。过去,想要在变更过程中监控网络质量变化,变更人员需要自行准备样本进行质量探测,同时逐个打开变更设备的流量视图以及关联区域的业务探测曲线,并在实施过程中实时关注这些页面。实施完成后,根据经验确认无异常,即结束变更。看起来行云流水又风平浪静的一次操作,往往在变更结束后却收到业务报障,此时才忽然发现变更存在异常,然后紧急回退来恢复业务,但从业务受到影响开始,到变更回退后业务恢复,影响时间已非常长,已经造成了严重网络故障,影响用户体验。如果能给变更加个“护身符
为活跃云原生日志服务CLS技术交流吧的技术氛围,鼓励广大产品运维技术开发同学们踊跃体验日志服务CLS产品,分享日志数据解决方案技术干货、系统平台接入日志服务CLS成功案例,日志服务CLS现举办“日志服务CLS体验”有奖征文活动。
腾讯云助手“云监控”小程序全新改版,给你全新的移动端体验!随时随地查看告警详情和监控数据,协助您高效运维!
01 为什么在腾讯云监控公众号推送了几次后才有这次“新手入门”的文章,故事要从小助手微信号说起... 前一阵云监控开通了小助手微信号(ID:云监控小M)(文末有小助手微信),小助手定位是建立和用户的快捷沟通渠道,同时将一些产品讯息,技术干货第一时间分享给用户。陆续有用户申请添加好友,并且私信小助手: “请问可以帮我监控QQ聊天记录吗?“ ”可以监控交易流水吗...“ 在诧异于这些用户对云监控的误解之大下,也想要好好跟大家科普云监控。 02 “腾讯云云监控是一项可对云产品资源进行实时监控和告警的服务
11月动态 云原生网关 【新功能】Kong 网关支持公网IPV6,方便客户端到网关使用IPV6通信。 【新功能】Kong 网关优化高级限流功能,支持自定义返回和对接自建Redis。 【新功能】Kong 网关支持添加多个公网负载均衡,提供多个公网接入点。 【新功能】Kong 网关支持关联腾讯云Prometheus,方便您使用云上Prometheus查看网关监控。 【新功能】Kong 网关支持请求/响应修改能力,您可以使用运行时变量对请求/响应进行新增/删除/修改。 【新功能】Nginx Ingress 支持自
随着云计算技术的广泛应用,越来越多的项目部署和迁移到云端,传统的监控告警系统在短时间内还不能适配云上的服务。为了实现实时系统运行状态的展示、故障的及时告警、历史状态的回看,可以基于开源的时序数据库Prometheus和可视化工具Grafana,搭配相关工具,快速搭建一个可靠准确的监控告警系统。本文记录了整个设计和搭建过程,以及遇到的一些问题和解决方法。
伴随着整个游戏产业的升级,游戏厂商对于游戏的研发与运营有着更高要求,特别是对于MOBA、FPS类型的大型游戏,为了提供更极致的玩家体验,游戏厂商在不断提高游戏数据管理效率方面面临着一系列的技术挑战,例如:
近年来,越来越多的用户在搭建网站或图床时将图片视频等资源上传到对象存储COS,提升了访问稳定性的同时降低了服务器的存储空间压力,但随之而来的流量盗刷、图片盗链问题也困扰着不少开发者,一旦存储空间被恶意访问,会产生高额的流量费用,产生不必要的纠纷。这类问题实际上可以通过多种手段来防护,本文将主要介绍一些常见的防护手段,帮助开发者合理配置存储桶,建立安全机制,降低因类似问题带来的大额资金损失的风险。
阅文集团是一家以数字阅读为基础,IP培育与开发为核心的综合性文化产业集团。集团汇聚了强大的创作者阵营、丰富的作品储备,覆盖200多种内容品类,触达数亿用户,已成功输出《斗罗大陆》《斗破苍穹》《鬼吹灯》《盗墓笔记》《琅琊榜》《庆余年》等网文IP改编的动漫、影视、游戏等多业态产品。
服务来源支持私有 DNS 解析器,用户可以添加自己的 DNS 解析器地址进行私有域名解析,适用于服务配置了私有域名的用户。
TEG为腾讯提供互联网行业全方位的运营解决方案和服务支持,运营着亚洲最大的网络、服务器集群和数据中心,拥有业内领先的基础架构云运营平台、云数据处理平台、互联网海量应用支撑服务平台,为亿级用户提供云计费服务和安全保障。这背后离不开一群7*24小时默默耕耘,负责标准化模块化数据中心网络架构、大集群平台自动化建设与运营,以及运营系统相关规划和建设,提供高可用保障体系的伙伴们。
2021年6月22日,中原银行SERVICE MESH平台二期项目招标公告发布,服务期限17个月(含项目建设期及免费维保期)。 建设中原银行Service Mesh平台二期,包括:管理平台、监控告警、数据平面、控制平面、网关、单体系统、Mesh开发框架等模块。管理平台实现服务管理、业务统计、监控展示、服务拓扑、告警管理、用户及权限管理、网关管理、平台部署及卸载、平台升级、数据平面升级、多集群纳管、统一管理门户入口功能;监控告警实现链路监控增强、指标监控增强、告警通知、小程序展示功能,数据平面实现容器调用顺序
由于某些原因,我们产品选择使用腾讯公有云作为基础服务进行建设,我们的产品形态是比较常规的web服务,以租户的形式提供Saas服务,根据不同使用方提供不同的业务功能。
科技是推动社会发展的重要动力,技术是推动行业发展的重要支撑力量。为便于读者了解腾讯云中间件产品的最新动态,腾讯云中间件推出产品月报专栏,每月一期。本月的三项动态如下:
The following article is from 腾讯技术工程 Author 腾讯程序员 作者:龙逸尘,腾讯 CSIG 高级工程师 为什么要构建监控系统 在后移动互联网时代,良好的用户体验是增长的基础,稳定的使用体验就是用户体验的基础。大型的互联网公司,特别是面向 C 端客户的公司,对业务系统稳定性的要求越来越高,因此对线上问题发现和处理的速度要求通常是分钟级的。比如滴滴等出行公司,打车服务停摆 10 分钟都会导致导致乘客、司机大规模投诉,不仅造成经济损失,而且严重平台商誉和用户口碑。 大型
转眼又到春节,又到了亲朋好友大团圆的时刻。对程序猿和攻城狮来说,能否安安稳稳的过年就主要取决于网络是否安稳了,谁都不想在合家团圆吃年夜饭的时候因为网络故障加班。不过,过去这一年各种网络却是故障不断:
前言 近日,小编被一篇“做程序员,挺!好!”的文章刷爆朋友圈,小编压抑不住满心的好奇,托人寻得那个“挺!好!”的程序员bottle,希望具体了解一下“挺好”背后的黑科技! 正|文| 小编:bottle你好!大家都对你具体如何实现“挺!好!”的技术细节非常感兴趣,但我更好奇的是,解决了“挺!好!”问题,单身问题也得到解决了吗? Bottle:没有。但是需求已经排期了,这个迭代解决“挺!好!”问题,下个迭代是解决单身问题。我们遇到什么困难,也不要怕,微笑着面对它!坚持,才是胜利!加油,奥利给! 小编:
李汇波,腾讯业务运维高级工程师,目前就职于TEG 云架构平台部 技术运营与质量中心,现负责微信、QQ社交类业务的视频转码运维。 摘要 随着短视频兴起和快速发展,对于视频转码处理的需求也越来越多。低码率高清晰,4K、超清、高清、标清适配不同终端和不同网络环境来提升用户体验,以及水印、logo、裁剪、截图等多样化的用户需求。 对于资源的多样化需求和弹性扩缩容也需要快速响应,而随着公司自研上云项目的推进,设备的稳定性和多样性可提供更多选择,来满足像朋友圈、视频号、广告、公众号等转码业务快速、稳定、抗突发的资源需
顾自然 腾讯云监控产品经理,硕士毕业于墨尔本大学。目前主要负责腾讯云业务层监控相关产品策划工作,对应用监控和运维领域有深刻理解。 前言 随着微服务架构的逐渐流行,在熵增且庞杂的系统中准确的定位一个请求的完整生命周期,逐渐成为了研发同学面对的最大的痛点之一,以研发同学自测过程为例,开发同学往往希望在发起测试的 Http/RPC 请求后,能够通过一个简单的方式获取整个测试请求的上下文信息。这其中通常包括相关的上下游链路、各个服务内部请求的方法堆栈,以及链路上打印的日志等数据,对于指标-链路-日志的一体化监控的需
为了给客户提供更优质、更可靠的服务,金蝶业务团队从2022年开始,就已经在腾讯云售后专家的协助下,陆续对业务系统完成双活改造。改造完成后,业务团队通过腾讯云混沌演练平台进行故障注入,以检验业务系统的容灾效果,从而提升业务系统韧性。本次演练主要针对金蝶小微业务线(精斗云&KIS云),涉及10大业务故障场景,是财务、新零售、电商等领域行业提高系统可用性的一次最佳实践。
云最难的,就是如何运维了,如何监控指标、告警、报表等信息并提前预判异常?出了故障能第一时间找到根因、路径吗?过程可视化吗?故此,小编找到我们 TCE 的运维产品经理,大家群策群力,倾情打造运维产品力专题,从价值视角,分享运维对云的贡献。
作为近年热词的SRE自被提出以来,引起了各方的关注和思考。随着技术的迭代,在基础运维、云计算运维的基础上,SRE工程师更多地关注工具化、流程化的建设,更进而地去思考平台化,体系化,全面化的技术栈设计。在业务侧的推动下,企业对敏态效率和稳态安全的全面关注;对保障稳定和质量同时控制成本、提升价值和效率等多方面的需求都对SRE在企业的内部落地提出了更高和更针对性的要求。
前言 根据《 Flexera 2020云状况报告》显示,多云环境正在成为企业的标准,93%的企业正在使用这种方式。 在部署架构方面,Kubernetes (K8s)是一种灵活的编排工具,它可以运行在本地、公共云和多个公共云。在这样的环境下,我们需要一套针对云原生环境、完善并且能实现多云监控的监控平台。自建 Prometheus,繁琐的集群关联步骤,让很多开发运维同学从入门到放弃。于是支持快速接入的托管 Prometheus 成为了大家的首选。 上期我们介绍了自建的 K8s 如何接入 Prometheus 监
腾讯云监控,可以覆盖1,2场景, 我们只需根据业务需求配置告警策略即可。场景3-Saas层监控可以分为服务状态监控、异常日志监控和接口监控。
欢乐互娱(上海)科技股份有限公司(以下简称“欢乐互娱”),是一家全球游戏研发和发行公司,聚焦于MMORPG和MMOACT两大品类,成功出品了众多知名游戏如《街机三国》、《龙之谷》和《英雄杀》等。2023年4月,欢乐互娱重磅新游大作《RO仙境传说》计划在东南亚发行,该项目开服规模大、影响用户范围广,做好游戏上线前的容灾准备以保障上线后的稳定性至关重要。
重磅 发布 近日,腾讯数据中心服务台在总部深圳全新升级投产,该平台是目前国内最大规模的数据中心集中化运营服务平台,支撑腾讯全球100+数据中心及百万级IT设备的运营服务工作;标志着腾讯数据中心正在加速向集中化、平台化、智能化运营方向升级和发展。 腾讯数据中心服务台综合服务大厅 当前,腾讯云在全球数十个国家和地区建立起100+中大型数据中心,支撑百万级IT设备的运营管理。数据中心体量大、分布广、运营管理方式多样化等特点,给打造腾讯云数据中心全球统一标准服务带来了巨大的挑战。 早在2018年,腾讯数据中心
在一些测试场景,或者新用户试用学习的场景下,正常的数据因门槛过高、数据敏感性、没有数据源等原因无法接入和使用,造成用户无法获取接近真实使用场景的体验。
为什么要构建监控系统 作者:龙逸尘,腾讯 CSIG 高级工程师 在后移动互联网时代,良好的用户体验是增长的基础,稳定的使用体验就是用户体验的基础。大型的互联网公司,特别是面向 C 端客户的公司,对业务系统稳定性的要求越来越高,因此对线上问题发现和处理的速度要求通常是分钟级的。比如滴滴等出行公司,打车服务停摆 10 分钟都会导致导致乘客、司机大规模投诉,不仅造成经济损失,而且严重平台商誉和用户口碑。 大型互联网公司的业务系统都是大规模的分布式系统,各种业务应用和基础组件(数据库、缓存、消息队列等)共同
游戏行业虽然蒸蒸日上,但目前传统游戏企业也不可避免地面临多重问题。三七互娱的运维总监龚宏绩给大家带来了“三七互娱游戏上云的现状与未来”的主题分享,总结了传统游戏企业现在面临的各个方面的问题,以及腾讯云可以为此带来的解决方法。
领取专属 10元无门槛券
手把手带您无忧上云