经过几年的平台建设,vivo监控平台产品矩阵日趋完善,在vivo终端庞大的用户群体下,承载业务运行的服务数量众多,监控服务体系是业务可用性保障的重要一环,监控产品全场景覆盖生产环境各个环节。从事前发现,事中告警、定位、恢复,事后复盘总结,监控服务平台都提供了丰富的工具包。从以前的水平拆分,按场景建设,到后来的垂直划分,整合统一,降低平台割裂感。同时从可观测性、AIOps、云原生等方向,监控平台也进行了建设实践。未来vivo监控平台将会向着全场景、一站式、全链路、智能化方向不断探索前行。
Kubernetes 在生产环境中的采用率越来越高,复杂度越来越高,由此带来的稳定性保障的挑战越来越大。
免费云监控:云监控 _ 云产品数据监控_云产品异常告警 - 腾讯云 (tencent.com)
11月动态 云原生网关 【新功能】Kong 网关支持公网IPV6,方便客户端到网关使用IPV6通信。 【新功能】Kong 网关优化高级限流功能,支持自定义返回和对接自建Redis。 【新功能】Kong 网关支持添加多个公网负载均衡,提供多个公网接入点。 【新功能】Kong 网关支持关联腾讯云Prometheus,方便您使用云上Prometheus查看网关监控。 【新功能】Kong 网关支持请求/响应修改能力,您可以使用运行时变量对请求/响应进行新增/删除/修改。 【新功能】Nginx Ingress 支持自
2022年2月 VOL:22 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ 云说新品 容器产品新特性2月上新 腾讯云容器服务公有版TKE 高可扩展和高性能容器管理服务 腾讯云容器服务(Tencent Kubernetes Engine,TKE)是高度可扩展的高性能容器管理服务,您可以在托管的云服务器实例集群上轻松运行应用程序。 控制台搜索框功能全面优化:支持根据集群状态筛选目标集群、节点/节点池lable搜索支持智能提示等 Addon架构升级,支持通过云API安装组件 CFS T
云原生 API 网关(专业版)支持CLS 日志大盘,提供状态码、请求量、耗时、错误日志、用户行为和业务分析等多个维度视图,适用于使用了 CLS 的用户。
腾讯云中间件 - 微服务团队产品2021年1月简报: 发布新品腾讯云微服务引擎 TSE。 腾讯微服务平台 TSF 新增功能:健康检查与注册中心联动;新增资源时可支持关联数据集;支持 Spring Cloud H 版本;全链路灰度发布支持跨命名空间;TSF 服务告警优化,容器集群导入云主机、安全组配置优化。 腾讯微服务观测台 TSW 广州地域发布;支持服务、接口、组件调用监控能力;支持具体接口调用多维度查询;支持系统内调用拓扑图动态发现。 消息队列 TDMQ 新增集群管理功能;环境更名为命名空间。
01、背景现状 tRPC 是腾讯自研的高性能、跨平台、插件化、具备高度服务治理能力的 RPC 框架, 目前在公司内各大业务广泛使用并已对外开源,详见:腾讯开
不论对于软件的用户还是开发者,日志都是很重要的信息源。日志可以用来表征软件的运行状态,在软件运行不符合预期时提供丰富的信息,也可以用在开发阶段调试软件,方便定位问题。
作为云上事件的收集分发管道,EventBridge 事件总线在业务的运维工作中也起到了重要的作用。云服务的业务变更或异常告警可以通过事件总线快速分发给用户,完成消息的通知或者对应逻辑的处理。目前,EventBridge 正式支持事件告警能力,仅需几步配置,即可实现业务告警的自动推送。 01. 方案简介 基于 EventBridge 事件总线的告警推送链路如下,业务方主动上报告警事件给到 EventBridge,用户通过配置事件的匹配规则,完成告警事件的筛选,并通过不同投递目标的配置完成消息的进一步处理。
云监控(Cloud Monitor,CM),收集并通过图表展示腾讯云云产品自助上报的各项监控指标和用户自定义配置上报的监控指标,以及针对指标设置告警。为您提供立体化云产品数据监控、智能化数据分析、实时化异常告警和个性化数据报表配置,让您实时、精准掌控业务和各个云产品健康状况。
一、一个时代的崛起 1. 腾讯新闻:资讯行业擎旗者的突破超越 2012年9月,腾讯新闻客户端安卓版正式发布。彼时,几大传统门户衍生的移动端资讯类APP早已上线推广,新闻客户端领域的用户争夺战,一触即发。2014年底,腾讯新闻在移动端的日活跃用户已达2.5亿,仅在第三方应用商店,腾讯新闻的下载量就达5亿次,是第二名的两倍。不久后,腾讯新闻客户端日活跃用户量已超过行业第二名的两倍,牢固确立领军者地位。 通过和微信进行合作,形成立体联动效应,腾讯新闻一路崛起。微信和手Q双插件渠道成为腾讯新闻客户端独有,其他
目前腾讯云 CDN 提供的防刷手段包括 IP 限频、IP 黑白名单、带宽或流量封顶等等,但除此之外,监控报警也是防刷中的重要一环,监控可以帮助用户迅速发现流量异常情况,并及时告警提醒用户对异常流量进行处理,以免产生高额账单或达量封顶后暂停服务影响正常业务。
导读:滴滴开源又双叒发布新开源项目啦——夜莺(Nightingale)是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。一起来了解项目详情吧。
总第516篇 2022年 第033篇 推荐系统是效果导向的数据应用服务,在功能的“有”和“无”之间,有很长的效果“好”和“坏”的光谱。本文以用户请求的粒度建立质量模型,通过数据血缘关联了数据表、算法模型、系统服务和用户请求,并结合美团综合业务的实践进行了拓展泛化,希望能对大家有所帮助或启发。 1 前言 2 现状分析 3 建设思路 3.1 业务语境下的质量 3.2 缺陷的考量和选择 3.3 度量和计算的选型 4 计算方式 4.1 计算公式 4.2 业务泛化 4.3 指标体系 4.4 血缘拓展 5 指标运营
乐元素是国内休闲益智游戏领域领航企业。为了给用户提供更稳定可靠的使用体验,在2023年Q2开始,乐元素运维、业务团队联合腾讯云售后专家和技术专家,基于针对乐元素旗下休闲游戏产品《开心消消乐》展开同城双活改造项目,目的是了解并改善业务容灾部署状况,进一步强化云上业务系统的容灾能力。
一、云函数 SCF + Ckafka 联合转储方案正式发布 发布时间: 2020-08-06 产品背景: SCF + Ckafka 联合转储方案可以帮忙用户节省使用与开发成本,用户可以将 Ckafka 消息转储同步转储至消息队列 Ckafka,用于 Ckafka 集群间的数据同步。 产品功能 高度可定制化支持自定义换行符、数据筛选等,帮助开发者快速实现 Ckafka 各种的场景转储服务。 转储消息队列 Ckafka 的方案将使用云函数 SCF 的 Ckafka 触发器进行,通过 Ckafka 触发器将消息
腾讯云中间件 - 微服务团队产品2021年10月简报: API网关:正式发布云原生网关 ,完美兼容开源 Kong 网关,为您幅度降低网关建设成本;支持条件路由插件,支持自定义认证/请求体插件。 微服务引擎 TSE :发布子产品服务注册中心、配置中心、治理中心。支持一键创建、免运维、高可用、开源增强的组件托管服务。 消息队列 TDMQ: 支持开源RabbitMQ备用交换机能力;支持客户端代码声明功能,原Spring内置客户端使用MQ的客户可以无缝迁移至TDMQ; 支持独占消费、支持集群维度的数据统计
简述 从 2020 年 11 月 1 日开始,第七次全国人口普查工作进入到正式登记阶段,700 万普查员走街串巷,他们需要在 15 天内,对近 14 亿人口进行入户登记,完成十年一度的「大国点名」。 与以往不同,本次大国点名全量上云,由腾讯云+企业微信为14亿人服务。腾讯云从业务部署、业务测试、压力测试到最终上线,并提供完善的日志,监控服务,只用了短短数月的时间,全程护航,让700万B 端用户,14亿C 端用户规模的服务稳定高效上线。 那么,腾讯云是如何支撑第七次全国人口普查的呢? 背景 十年一度
当他睡眼惺忪、手拿红牛、嘴刁香烟迈着沉重的步伐从某网络核心机房走出来的时候,除了看门大爷简短问候之外,也只有刚刚过去的这个黑夜才真正懂得刚刚发生了什么,在外人眼里,这个夜晚再正常不过,和往常一样,刷刷微博、看看抖音,逛逛购物网站,即便是前一晚上有某些人觉得打开购物网站的页面有点卡慢,他们也可能不会放在心上,然而正是因为这样一个不一样的网络体验,网络工程师们已经是废寝忘食,鏖战了整整一夜,来修复引发这个网络卡慢的bug,在外人眼里一觉醒来,看似波澜不惊,但有时实则是暗流涌动;
周成,腾讯云工程师,主要负责腾讯 etcd 监控平台设计、开发、运维工作,具备大规模 Kubernetes 和 etcd 集群运维开发经验。 唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者, 主要负责腾讯云万级K8s集群和内部业务的公共etcd平台以及serverless 产品研发设计工作。 背景 随着 Kubernetes 成为容器编排领域的霸主,越来越多的业务大规模在生产环境使用 Kubernetes 来部署、管理服务。腾讯云TKE正是基于原生 Kubernetes,提
自建 Redis 系统是得物 DBA 团队自研高性能分布式 KV 缓存系统,目前管理的 ECS 内存总容量超过数十TB,数百多个 Redis 缓存集群实例,数万多个 Redis 数据节点,其中内存规格超过 1T 的大容量集群多个。
在上一期《数据中枢》中介绍的配置数据管理工具 CMDB,配合云哨监控系统的预设告警策略,可以实现常用监控告警的自动化配置。今天我们的主角就是运维平台中的最强警戒线——云哨系统。
腾讯云事件总线(EventBridge)与腾讯千帆鹊桥 iPaaS 携手,将安全、稳定、高效的无服务器事件管理平台与腾讯千帆鹊桥 iPaaS 的多种连接器集成,通过 「EB x iPaaS x X」架构,可以快速构建各种业务场景,帮您以配置化的方式轻松实现无服务器事件驱动架构的搭建。 通用业务场景下,监控告警 是必不可缺的运维模块,如何有效监控到告警信息并及时进行自动化处理,是每个业务方都需要思考和面对的问题。基于事件总线 EventBridge 和腾讯千帆鹊桥 iPaaS,腾讯云提供了一套完整的监控运维
腾讯云中间件 - 微服务团队产品2021年4月简报: 微服务观测平台 TSW 正式公测 微服务引擎 TSE 支持Zookeeper、Eureka注册中心托管与集群创建、删除、升级、信息展示;支持Consul、Zookeeper、Eureka注册中心基础业务指标监控;支持Consul、Zookeeper注册中心数据持久化能力;支持注册中心服务管理可视化;香港开区;优化用户体验 微服务平台 TSF 微服务网关升级;支持查看容器集群创建和部署组发布事件;TSF程序包上传流程优化;Java启动参数支持配置
随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用,而企业运维中的痛点和难点也急需解决。
最终结果是三分之一的直播录制视频完全丢失,其它的录制视频都是不完整,也就是说只录制了前半部分,后半部分是没有的。
我们知道,SSL证书是提供服务器身份验证和数据传输加密功能的安全服务,能为网站提供一站式的 HTTPS 解决方案。那么,在完成SSL证书的购买和部署环节后,如何对SSL证书进行智能高效的管理?包括安全管理监控、异常处理等等重要环节。我们要推荐的是「证书监控SSLPod」这款服务。 什么是「证书监控SSLPod」 证书监控(SSLPod)是一款集多个 HTTPS 站点安全检测、证书有效期管理以及异常告警等功能于一体的系统。它提供了可视化评级图表和可交互的跨品牌证书管理仪表盘,还能够及时地将异常情况通
服务来源支持私有 DNS 解析器,用户可以添加自己的 DNS 解析器地址进行私有域名解析,适用于服务配置了私有域名的用户。
出品| 区块链大本营(ID:blockchain_camp ) 在当下,云原生的火爆不容小觑。随着虚拟化技术的成熟和分布式框架的普及,在容器技术、可持续交付、编排系统等开源社区的推动下,以及微服务等开发理念的带动下,应用上云已经是不可逆转的趋势,云原生(Cloud Native)的概念也应运而生,更是火得一塌糊涂。 Cloud表示应用程序位于云中,而不是传统的数据中心;Native表示应用程序从设计之初即考虑到云的环境,原生为云而设计,在云上以最佳姿势运行,充分利用和发挥云平台的弹性+分布式优势。 而作为云
婚芭莎(中国婚博会)App主要为结婚新人提供一站式备婚方案,包括一二线城市各大主流结婚品牌;专为中国结婚新人提供线上备婚指导教育,线下体验订购服务平台。
刘志祥 腾讯医疗健康高级前端开发工程师,腾讯前端监控 Oteam PMC 成员,主要负责小程序监控系统的设计和开发。 微信小程序现状发展 在今年的微信公开课 PRO 上,微信小程序负责人曾鸣披露了2021年小程序的大盘数据。数据显示,2021年微信小程序 DAU(日活) 达到了 4.5亿+ 的规模,小程序开发者超过了 300 万。 随着小程序的高速发展,越来越多的重点业务以小程序的产品形态展示在用户面前。前端作为用户访问业务的直接途径,对用户体验的重要性不言而喻,若出现页面出错、卡顿、崩溃、损坏等页面异
12 月 3 日、4日,2022 Apache IoTDB 物联网生态大会在线上圆满落幕。大会上发布 Apache IoTDB 的分布式 1.0 版本,并分享 Apache IoTDB 实现的数据管理技术与物联网场景实践案例,深入探讨了 Apache IoTDB 与物联网企业如何共建活跃生态,企业如何与开源社区紧密配合,实现共赢。
从2020年疫情爆发以来,全国上下均处在疫情防控常态化期间,“健康码”已经成为各地大量人员流动场所进出的重要凭证。
10月动态 云原生网关 【新功能】Kong 网关支持弹性伸缩:Kong上线根据 系统指标(CPU利用率)自动扩缩容能力,您可以配置弹性伸缩策略,Kong 将自动对节点进行弹性伸缩。 【新功能】Kong 网关支持使用 Kong Ingress Controller:Kong上线使用 Kong Ingress Controller 能力,方便对接您的腾讯云容器集群。 【新功能】Kong 网关支持高级限流:Kong 上线高级限流插件,支持多时间维度、资源维度的分布式限流和请求排队等能力。 【新功能】Nginx I
5 月 18 日,腾讯云举办了 Techo Day 腾讯技术开放日,以「开箱吧!腾讯云」为栏目,对外发布和升级了腾讯自研的一系列云原生产品和工具。其中,腾讯云开发者产品中心总经理刘毅围绕“开发敏捷高效”这一话题,分享了关于“云原生应用开发与运维新范式”的主题演讲。本次演讲将为大家分享,腾讯云是如何通过云上开发运维协作能力,支持多职能团队流畅协作,助力企业加速数字化敏捷转型,提升云原生架构的运维效率,受益云原生。
内存量,缓存大小,读取和写入磁盘的速度以及处理能力的速度和可用性都是影响基础架构性能的关键因素。在本教程中,我们将重点介绍CPU监控概念以及警报策略。我们将介绍如何使用两个常见的Linux实用程序,uptime命令和top命令了解CPU负载和利用率,以及如何设置腾讯云警报策略以通知您有关CVM CPU的高负载情况。
作者介绍:2012年进入腾讯,负责腾讯云数据库平台(CDB)和腾讯云分布式存储平台(CBS)的运维工作,对数据库高可用、数据库调优、分布式存储运维等领域有丰富的经验。 记CBS一次动人心魄的数据保卫战 接触分布式存储已经有一年多的时间了,首次遇到存储侧三份数据都有异常的情况,三份数据异常意味着客户数据的丢失,这个对云存储来讲是致命的打击。为了保证数据的安全,CBS运维和开发的同学进行了持续两天一夜的数据保卫战,最终做到数据0丢失,那么CBS运维和开发的同学是如何通过紧密合作来扭转乾坤的?且听我慢慢道来:
开箱即用的云端全托管 ELK 服务,集成 X-Pack 特性,独有高性能自研内核、自治索引、集群巡检等优势能力,轻松构建日志分析、信息检索、数据分析等业务。
hello,腾讯云的小伙伴们,我是不想赖床,一位拥有2年腾讯云服务使用体验的计算机大学生。我们在使用腾讯云服务器时,在各种业务开发部署过程中会产生各种日志,如果产生错误信息,我们还需要去服务器文档中查找日志然后再去解读日志并找到问题,这样就会浪费很多时间。
云厂商提供的按需按量付费的云主机,对中小企业、个人用户来说,其低成本、高可靠以及易管理性,是非常有吸引力的,但是,千万别忽视云主机面临的安全威胁 -- 公有云上庞大的云主机群,也是黑产持续关注的热点区域,今天我们来聊聊,从普通用户角度,有哪些办法可以快速提升云主机的安全性。
作者:黄小龙,腾讯云云监控高级工程师 前言 近期,某券商 APP 出现异常,大部分用户出现无法登录,数据显示异常等问题。由于行业的特殊性,股票交易对于时效的敏感性,出现这样的异常会造成无法预估的影响。 在业务发展过程中,通常会过度的关注如何设计高可用、高可靠的架构,往往忽略会了真实的用户体验。业务真正上线后,将面临接踵而来的体验问题。 为什么会有大量用户反馈体验不佳?访问缓慢? 为什么还是有部分地区的用户无法访问? 为什么业务域名访问会被劫持或者被封堵? 为什么业务页面会被篡改,且无法第一时间获悉? 如
为避免聚集性疫情发生,阻断病毒传染、及时发现疑似病人,全国各地均已采取最严格的发热人员排查措施,防止疫情进一步向外扩散。返工潮人流涌动,站好温控第一道岗,成为疫情狙击战的关键。目前机场、高速公路出口与服务站、地铁站、高铁站、超市、写字楼、小区、学校、场馆、工厂等人群高度聚集、高流动的公共场所与活动密集区,都需要对大流量群众进行实施体温监测。
某游戏公司,BACKEND 服务集群在首尔。该公司不希望部署多套逻辑和数据层,从而降低成本,但又希望全球的客户能够接入,需要全局漂移 IP 作为访问的唯一入口,并可做全局的就近分配、动态流量分配、故障剔除
腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。 7月,腾讯云慧眼、腾讯云OCR、腾讯云神图、语音识别、NLP自然语言处理推出全新功能;腾讯云OCR、腾讯云神图、TTS语音合成优化了核心性能。 腾讯云慧眼 身份证识别及信息核验 通过OCR识别或手动输入姓名和身份证号或传入身份证人像面照片提供所需验证信息,校验姓名和身份证号的真实性和一致性。可应用于游戏、直播、电商、运营商等场景。 身份证人像照片验真 传入
作者:张加浪,腾讯云云监控高级工程师 前言 某电商客户的网站加速 30% ,调用成功率上升3%,实现了分钟级定位故障...... 某银行实现端到端的全链路覆盖和性能量化,解决了多处性能短板...... 在云原生时代,且业务架构复杂、用户量庞大的场景下,他们怎么都能轻而易举地实现了? 方案背景 自研业务上云、业务服务云化,底层 IAAS、PAAS 等资源托管依赖,业务聚焦于业务逻辑实现。使用微服务框架开发服务进行敏捷开发,服务模块化运作。资源依赖托管、业务微服务化这些使得服务研发、运营变得更符合云化,
作者:张加浪 腾讯云监控高级工程师 背景 十年一次的人口普查是涉及全国十几亿人的重大事情,每次人口普查都是对国人的一次梳理,国家和人民都十分重视。随着技术的不断创新,人口普查的普查方式也在不断升级,从人工加算盘到人工加老式计算机,再到卫星传感。 在第七次全国人口普查 (以下简称 “七人普”) 的到来之际,国家决定通过 “电子化方式普查登记,腾讯提供技术支持” 更快更准的普查方式,即实行云端普查登记。 七人普主要通过小程序方式进行制证、普查员注册、人口普查等,700 万的普查员,十几亿的普查对象,服务必
杨豪,腾讯云研发工程师,腾讯云智聆口语评测研发骨干。目前负责腾讯云智聆口语评测整体架构优化与系统迭代,专注于降本增效与服务可靠性提升。 邓琨,腾讯云高级研发工程师,专注于微服务云原生架构探索。负责智聆口语评测自动化运维上云建设,助力业务降本增效。 背景介绍 腾讯云智聆口语评测(Smart Oral Evaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,提供单词、句子、段落、自由说等多种评测模式,从发音精准度、流利度、完整度等全方位打分机制,与专家打分相似度达
领取专属 10元无门槛券
手把手带您无忧上云