平台事件

最近更新时间:2019-08-20 19:10:40

事件定义

平台事件是对腾讯云底层基础设施服务变更的记录,由腾讯云自身基础设施与服务产生或导致,平台事件从属于底层服务维度。客户对事件不可控,由腾讯云处理与实施。

每一条平台事件记录由以下字段属性组成:

属性 说明
事件 产生事件的底层基础设施与服务所支撑的产品+事件名称
时间 事件记录发生时间,精确到秒
事件类型 根据事件产生的原因与影响,分为问题、变更、运行公告和其它订阅;现已支持问题类平台事件,其它订阅作为非腾讯云产生但会影响底层基础设施的外部事件供客户订阅
关联资源 根据事件所影响的基础设施与服务间接关联,对单个账户影响的资源实例可能会有多个
状态 对于问题类平台事件,描述事件触发与恢复;对于变更类平台事件,描述事件开始与结束;对公告类事件,无状态概念
地域(如适用) 平台事件所影响的底层基础设施与服务所在的地域
注意:

对于有状态描述的平台事件,由先后两条事件记录关联。为了方便通过控制台定位与了解基础设施与服务状态,合并展示两条关联原始事件记录,通过状态字段来更新特定平台事件进展。事件触发与恢复记录由开始时间与更新时间区分。

功能

平台事件模块获取并记录平台基础设施与底层服务产生事件,并通过以下功能支持客户执行展示回溯,告警通知,api拉取,自动化联动触发等用例。

  • 事件筛选:支持从时间跨度,事件类型,事件,事件状态,状态和地域等属性筛选事件;支持多选,单个属性多个筛选值取或操作,多个属性间取与操作。
  • 影响对象关联事件搜索:支持对影响对象ID进行搜索关联平台事件。
  • 订阅平台事件:支持以订阅形式及时获取特定基础设施与服务平台事件信息

平台事件处理进展实时更新,事件拉取API与自动化联动触发能力支持中,后续逐步开放。

场景

  • 告警触达及时规划与处理问题: 订阅关联特定产品的平台事件,及时获取平台问题与变更信息,快速规划资源变更与跟进问题处理进展
  • 回溯定位异常: 平台事件处理信息记录作为回溯定位异常的参考,辅助判断问题致因。
  • 自动化触发联动操作:自动化触发规则事件源支持平台事件,实现自愈、自动化调度等操作,提高监控运维效率

使用限制

  • 事件信息最长可查看时间为半年
  • 告警短信发送计入短信配额

操作指南

筛选事件

使用全局事件筛选能力,查询特定属性组合的平台事件信息
1) 登录 云监控控制台
2) 单击左侧导航栏中【事件中心】>【平台事件】,进入平台事件页面。
3) 单击页面右上方全局筛选搜索框,可分别修改默认筛选项【事件类型】与【事件】单击完成确认;或自定义新增【地域】和【事件状态】筛选项后并单击完成执行筛选。左上方时间筛选框自定义筛选特定时间区间内更新的事件。
4) 上下滑动事件列表页面滚动条与选择页面翻页导航查看筛选结果。

搜索影响对象关联事件

查看特定影响对象所关联的事件信息
1) 登录 云监控控制台
2) 单击左侧导航栏中【事件中心】>【平台事件】,进入平台事件页面。
3) 单击页面右上方全局筛选搜索框,选择【影响对象】搜索项,输入资源对象 ID 后回车键确认。
4) 上下滑动事件列表页面滚动条与选择页面翻页导航查看搜索结果。

订阅平台事件

订阅关联特定产品的平台事件信息触达接收人
1) 登录 云监控控制台
2) 单击左侧导航栏中【我的告警】>【平台事件订阅】, 进入平台事件订阅页面。
3) hover 订阅项,单击显示的【订阅管理】,选择信息接收方式与接收人然后单击确认。
4) 订阅项列表显示对应最新接收方式与接收人信息。
5) 订阅告警记录可于【告警历史】查看。

覆盖事件

当前平台事件支持以下事件,其余关联产品逐步支持中。

事件类型 事件 原因 影响
问题 云服务器存储问题 云服务器基础设施存储模块导致 云服务器实例IO性能下降 ,数据读写异常
问题 云服务器网络连接问题 云服务器基础设施网络导致 云服务器实例网速下降或网络连接中断
问题 云服务器运行异常 云服务器基础设施导致 云服务器高负载或宕机,服务不可用

问题处理建议:腾讯云负责处理修复,根据告警信息提示对所影响资源进行处理授权,或等待处理。可参考信息进行服务调度与迁移。

事件类型 事件 原因 影响
其它订阅 运营商网络抖动 运营商网络问题导致 外网访问腾讯云服务延迟增大或连接中断