首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数栈MSP运维服务案例:某客户生产服务器CPU异常抖动

一、问题背景 某日袋鼠运维小哥进行例行运维巡检,通过监控视图发现客户应用服务器cpu使用率突然呈上升趋势。...二、异常现象 随着时间推移,运维人员收到不同应用系统主机系统资源占用过高的告警通知,但客户反馈业务上并没有受到明显影响,且处于业务低峰期。...四、异常处理 经过上述分析,与业务方确认ssh 连接客户端是否为内部系统IP地址,最终定位异常实例被内网其他机器恶意破解,进行非法访问入侵。...五、案例总结 从服务器安全防护的角度出发,应将业务部署在上隔离的网络环境,并修改默认远程服务监听端口,按需开放安全组访问限制。...如果业务部署早期未做相关规划,建议尽快迁移经典网络下的服务器到专有网络环境,同时需要定期对服务器进行体检及安全检查,以确保服务器安全。 ---- 本文首发于:数栈研习社

1.8K20

复盘:某客户ES上问题案例总结

说明本文描述问题及解决方法同样适用于 腾讯 Elasticsearch Service(ES)。背景客户自建近100个ES集群,服务于多个核心重要业务。...需求各有所异、集群容量利用率参差较大、部分混布集群资源成本难以继续细分,出于人员不足,运维压力、增强稳定性保障、优化利用率和成本等角度考虑,计划将全部自建ES集群基于业务属性、重要等级等方向按批次迁移至 腾讯...图片图片解决方案短期方案重启generic 线程被长期占用的节点,释放 recovery 资源,集群恢复 green 长期方案内核级别干预 indices.recovery.max_bytes_per_sec腾讯...ES 内核添加限制,避免 max_bytes_per_sec 设置过小(1MB)腾讯 ES 智能诊断系统,发现 max_bytes_per_sec 设置过小时,自动纠正问题二:RT上涨集群偶现部分节点长时间

1.1K113

客户案例】巡检项:直播(CSS)license 有效期

故障发生时间,正值直播业务APP高峰访问时间,而在直播过程中突然遭遇直播间无法观看,客户的技术运维和业务侧都面临非常大的挑战。...客户报障后腾讯侧紧急介入检查,而原因也很简单,移动直播license到期,更新license后业务随即恢复。在到期前客户收到短信提醒,但是消息过多且正值国庆假期,消息未被关注到。...顾问解决方案 虽然故障原因简单,但业务影响严重。此前客户通过控制台站内信方式和短信提醒方式极其容易漏掉此类通知,而漏掉的后果就是业务直接宕掉。...顾问会有此类风险的针对性巡检,当license有效期小于15天且未进行更新就扫描出该高风险项,提醒用户及时进行处理和规避。 在此以后,客户再也没有出现此类故障,在提高业务稳定性道路上更进一步。

44850

客户案例】巡检项:数据库(MySQL)主从延迟

背景描述 某金融企业近期BI系统读取数据时发现核心主库和从库数据存在不一致,影响BI系统读取数据,导致客户的BI系统读取到了脏数据,生成的报表无法使用,延迟了业务线的处理时间。...此类故障对金融客户属于生产故障级别,如果重复出现,会影响银保监会对客户的安全评估。...顾问解决方案 因为数据库在金融客户的数据存储以及调用业务中是非常重要的,且金融客户的重点业务对稳定性需求极高,要求产品在使用过程中得到提前预警和定期优化,所以顾问对数据库(MySQL)主从延迟也是重点监控...,如果近 1 天主从延迟大于 3600s,顾问会记录为高风险。...大客户售后经理配合客户优化数据库的过程中,依赖顾问定期对数据库进行巡检,数据库的风险项逐项排除,很好的避免了主从延迟以及库不可用的情况。

99511

客户案例】巡检项:数据库(Redis)高危命令检查

同时,客户DBA负责人反馈线上业务使用的数据库Redis CPU飙升到100%,并且发现监控页面的数据无法显示当前的负载情况,需要腾讯尽快解决。...顾问解决方案 客户反馈问题后,大客户售后经理紧急联系当天值班的数据库运维同学进行排查,排查后发现Redis数据库CPU负载飙升的原因是有大量keys *命令导致的,占用了大量的资源,直接导致数据库卡死...,连带监控也无法获取到监控数据。...经过和客户沟通,建议客户开通顾问的巡检服务,顾问中有针对数据库Redis高危命令的检查。...客户开通顾问服务后,通过巡检报告发现上百个redis实例存在使用高危命令的风险,客户根据提供的建议进行整改后,没有再次出现由于高危命令导致的线上故障,提升了业务的稳定性。

1.2K40

客户案例】巡检项:数据库(MySQL)RO 组单点

背景说明 某医疗企业线上APP采用MYSQL数据库,该库只设置了一个RO实例,并没有设置RO组多实例,客户的信息调度全部依赖此库。...在某次RO实例发生事务性故障的时没有其他实例可用,导致客户业务APP无法正常使用。...当时只能通过腾讯后台把VIP切换到备库紧急恢复业务,在RO单点实例恢复服务后,再切回到RO的IP, 切换过程会造成闪断。整个故障处理过程持续了23分钟,对客户影响比较大。...顾问解决方案 为了不让其他客户再遇到类似的情况,避免对客户的业务造成损失,顾问增加了对RO单点的巡检项,旨在帮助客户提前发现问题,规避问题发生,更好的帮助客户在腾讯上运行各项业务。...该客户通过顾问巡检到有此类风险场景的所有实例,在后来的工作中配置了RO组多实例,到目前为止,没有再出现同样问题。

53720

客户案例 | 无缝转接客户,升级服务体验

痛点 解决方案 效果 客户接待信息杂乱且难以留存 聊天记录可留存,客户轨迹清晰明了;利用客户标签定位客户属性/需求 可随时根据聊天记录迅速定位客户需求,提升了工作效率 客户转接环节易中断,客户体验差 通过员工接待在员工间一键转接客户...企业简介 深圳市傲冠软件股份有限公司(Skybility Software)成立于2007年,成立以来通过战略重组承接和融合了原傲冠电脑的研发技术、销售和服务体系,并不断提升自主研发能力,专注Linux、计算和移动互联网技术...10年,已成长为一家拥有“行服务”这一自主专利的创新技术模式和商业模式的专业IT服务商。...2016推出“行管家”计算管理平台,帮助上企业管理资源,控制成本,提供安全保障。目前已有4万多家企业入驻该平台。 ? 企业主号接待,转接更顺畅 ——业务员之前与客户沟通一般用什么方式?...● 看完案例有什么疑问?欢迎扫描下方二维码咨询企点在线客服。 ? ? 点击下方“阅读原文”了解更多关于腾讯企点。

67810

客户案例 | 打造高效协作的专业客户服务

,体现服务专业度 故障问题涉及售后与工程师多方对接,内部流转效率低 在企业主号形象下,内部人员可互相转接,协同处理客户问题 内部流转速度快,客户无感知,客户满意度更高 服务需多人承接,承接过程的历史记录难以同步...,沟通繁琐 通过查看客户轨迹、消息记录等,让异地服务响应时,可清晰了解之前的处理进度 客户无需反复描述报障内容,极大提升了客户的服务体验 企业简介 安恒利(上海)影视设备有限公司是安恒利(ACE)集团公司旗下的子公司...加强团队协作,高效沟通客户 ——业务员之前与客户沟通一般用什么方式?使用企点后有哪些便利之处?...程珏(客户服务高级经理):使用企点之前, 售后通过客服电话与客户沟通,之后联系客户添加对接工程师QQ或者拉QQ群, 在QQ里反馈故障情况,、核对信息, 再通过线下转单(e-mail)处理。...集中管理客户,持续转化商机 ——企点对于员工的日常工作有什么帮助吗? 程珏(客户服务高级经理):使用企点后,我们的员工在接待客户时更加得心应手。

95220

客户案例 | 以优质客户服务提升产品口碑

痛点 解决方案 效果 客户咨询量大,接待不及时,客户体验差 通过企点的智能路由分配,合理分配客户 接待效果良好,响应及时,客户服务体验提升 产品使用有难度,无法直接指导客户,缺乏直接有效的沟通方式 通过企点远程控制...、音/视频功能,为客户提供一对一教学指导 丰富沟通形式,提高客户对产品的满意度 客户量大,客户信息杂乱,难以有效留存 通过企点海量客户库沉淀客户信息,留存客户资源 客户信息一目了然,有效把握客户资源转化商机...多通路多渠道,高效连接客户 ——以前售后服务人员与客户沟通一般用什么方式?使用企点接待客户后,有哪些便利之处?...比如使用远程控制帮助客户设置电脑,语音指导客户使用产品,对于一些年龄较大的客户,会使用视频功能指导客户使用硬件。 ? 海量客户库,沉淀客户资源 ——你觉得企点在使用中有什么优势?...企点在这方面有优势,客户库容量更大,可容纳大量客户,保护客户资源不流失,也方便了对客户进行统一集中管理。 ? ?

87120

数栈运维案例客户生产服务器CPU负载异常处理

本文整理自:袋鼠技术荟 | 某客户生产服务器CPU负载异常处理 一、问题背景 一天下午,大家都在忙着各自的事情,突然小组人员都同时收到了短信提醒,以为是公司发奖金了,很是开心,咋一看“某某客户服务器cpu...原来是告警短信,同时看到钉钉群里发出了大量的告警信息…… 二、故障回顾 告警提示”CPU使用率到达98%” ,打开阿里控制台,通过监控发现在下午15:06-16:46左右,上机器某四台集群服务器cpu...同时在大量的fpm-php重启时会消耗大量的CPU load, PHP不接受业务请求、不转发数据,服务器流量直线下降。...四、优化建议 根据服务器的CPU/内存配置,适当增加children的数量和max_requests的请求数。如下图,设置一个比较大的值。 ?...六、写在最后 基于互联网在线化方式,袋鼠客户提供上网络和资源规划、应用架构规划、性能优化、监控告警、系统健康检查、业务大促护航、上安全运营等全方位的专业运维服务,保障客户业务系统在上稳定运行。

66310

【Java 网络编程】UDP 服务器客户端持续交互 案例

文章目录 I UDP 交互原理 II UDP 服务器端代码示例 III UDP 客户端代码示例 IV 服务器 客户端 运行结果 I UDP 交互原理 ---- 1....接收信息设备监听 X 端口 : 此时 A 作为客户端时 , 服务器需要接收 A 发送的数据包 , 服务器需要监听一个指定的接口 X , 那么如果 A 发送广播消息 , 监听 X 端口的服务器就会收到 A...持续交互 : A 不断向其它设备的 X 端口发送信息 , 其它设备可以不断反馈信息给设备 A 的 Z 端口 , 这样就实现了客户端与服务器端数据交互的功能 ; II UDP 服务器端代码示例 ----...运行结束"); } } } /** * 封装向服务器端发送数据的客户端信息 * 主要是保存客户端的 IP 地址和端口号...运行结束"); } } } IV 服务器 客户端 运行结果 ---- 先运行服务器端 , 再运行客户端 ;

1.5K30

客户案例】巡检项:数据库(Redis)跨可用区部署

背景说明 由于北京二区机房某一个电力模块故障,导致某汽车行业客户一个线上核心Redis数据库异常无法使用,收到大量汽车用户的投诉,需要尽快恢复业务。...客户反馈问题后,大客户售后经理紧急联系数据库技术服务专家,高优先恢复客户的数据库,但是由于客户主备数据库实例都是部署在同一个可用区,并且同时受到了断电的影响,如果要恢复只能通过最近时间点的备份进行恢复,...还好在通过备份数据恢复数据库后,客户的业务可以正常使用,并没有收到用户的报障。但是,由于整个断电时间比较长,对客户业务的影响比较严重。...顾问解决方案 复盘客户的问题发现,其实顾问的Redis评估项中包含了跨可用区部署的评估,而且每周还会发送数据库的隐患报告给客户,但是客户认为已经是主备架构的数据库,就没有去考虑跨区的部署。...经过和客户沟通,我们会协助客户对核心数据库进行重点解读,并推动客户尽快去整改,避免类似问题发生。

1.3K30

客户案例 | 高效管理客户,赋能企业智慧经营

通过企点账户中心随时调取历史数据,聊天记录 有效留存聊天记录,既可持续跟踪需求,又保障了企业信息安全 企业简介 浙江中之杰智能系统有限公司是一家以计算技术、智能系统集成为核心,集智能软硬件销售、研发...、咨询、教育及平台运营、智能制造服务为一体的新一代高新技术产业公司。...同时,客户管理也不完善,有时候人员的流动会带来客户信息的丢失。...更有大容量客户库管理商机,通过权限设置,保护客户资源,持续跟踪需求,转化商机,也不必担心信息错乱、丢失导致的客户流失了。 ? ?...● 看完案例有什么疑问?欢迎扫描下方二维码咨询企点在线客服。 ? ? 点击下方“阅读原文”了解更多关于腾讯企点。

66410
领券