首页
学习
活动
专区
工具
TVP
发布

腾讯&运营网络智能运营实践

欢迎关注公众帐号“鹅厂网事”,我们给你提供最新的行业动态信息、腾讯网络服务器最接地气的干货分享,还有一大波互动交流板块和有奖活动正在筹备当中,需要您的热情参与哦,敬请期待!...腾讯数据统计发现有70%故障来源于运营网络,因此,如何快速定位和处理运营网络故障就是摆在运营同学面前的一个课题。         ...CBA项目也基于上述方法在运营商基础网络内进行FULLMESH探测,同时结合运营网络特性,联动运营商节点地址库、网管数据等海量源数据,打造新版智能化分析内核,快速定位到运营商故障的节点设备及接口,缩短人工定位时间...Step2 腾讯工单系统报障:网络工单系统会根据场景(比如质量、专线、出口)自动收集故障信息以结构化形式通过接口给到运营商。 Step3 运营商系统受理:收到腾讯报障后系统秒级生成工单号。...Step4 腾讯工单系统查询进度:腾讯按分钟轮询运营商接口,拉取运营商处理进度。 Step5 腾讯网络机器人反馈进度:腾讯通过机器人将每一个进度实时推送给业务同学。 ?

1.9K61
您找到你想要的搜索结果了吗?
是的
没有找到

浅谈服务器海量运营

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络服务器行业动态信息,同时分享腾讯在网络服务器领域,规划、运营、研发、服务等层面的实战干货...因此,要支撑服务器的海量运营,首先需要建立和维护一套基础架构的CMDB。如图所示,配置管理主要记录与服务器相关的基础架构关联关系,包括位置信息、网络信息、业务信息等。 ?...随着规模慢慢发展,当一个机房负责人需要管理多个机房,甚至分工更细,一个机房由多人维护,特别是机房现场引入外包机制时,这种线下维护方式就会制约运营的质量和效率,比如设备的位置变更,网络端口的变更、IP信息的变更等...比如通过服务器的检测发现系统,实时采集服务器的相关信息,与配置信息及网络交换机的实时信息对比,一旦关键信息出现变化,立刻告警通知,通过多种类似的手段来保证CMDB在动态运营中的准确性。...二、自动高效的故障修复体系 数十万体量的服务器,即使将故障率控制的很好,也会带来为数众多的故障单,加上受基础环境(如网络异常)等影响引发的告警,每天会产生大量重复的运营工作:现场健康巡检、一线告警确认、

1.5K60

大型DCI网络智能运营实践

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络服务器行业动态信息,同时分享腾讯在网络服务器领域,规划、运营、研发、服务等层面的实战干货...在2018 GOPS全球运维大会上海站,来自腾讯TEG网络平台部网络运营负责人何维兵,做了主题为「大型DCI网络智能运营实践」的分享。以下为根据现场演讲整理的文稿。...何维兵,来自腾讯TEG网络平台部,资深运维老兵,拥有10年运营网络、6年互联网基础设施运营经验,擅长大型骨干网络、数据中心网络维护管理和运营支撑系统规划建设,目前专注于网络自动化运营、NetDevOps...以及网络智能运营的实践探索。...欢迎关注公众帐号“鹅厂网事”,我们给你提供最新的行业动态信息、腾讯网络服务器最接地气的干货分享,还有一大波互动交流板块和有奖活动正在筹备当中,需要您的热情参与哦,敬请期待!

7.8K60

大型DCI网络智能运营实践

我们同步了嘉宾现场沙龙分享视频(内含高清PPT),请点击下方「腾讯技术课小程序」卡片即可查看: 同时附上整理好的演讲稿: 何维兵,来自腾讯TEG网络平台部,资深运维老兵,拥有10年运营网络、6年互联网基础设施运营经验...,擅长大型骨干网络、数据中心网络维护管理和运营支撑系统规划建设,目前专注于网络自动化运营、NetDevOps以及网络智能运营的实践探索。...运营苦、运营累,关键时刻不能跪!!! 记得有一年微信年会,老板现场发红包给大家,结果红包没发出去,因为网络出故障了!你们能想象到当时有多尴尬。随后老板找到我们提了需求,重要业务要在三分钟恢复!...那我们就想,干脆就从业务的角度监控,就拿机房的海量服务器去做这样的事情。 其实很简单,就是选取一部分机器作为探测对象,然后机器之间交叉探测。...因此我们最近2年在对网络进行抽象建模,对硬件连接、对配置特性、参数,包括运营的状态进行模型化的抽象定义,简单说就是构建比较完整的网络知识图谱。

87120

网络安全运营能力建设思路

一、安全运营能力建设的意义 安全运营成为网络运营者持续不断思考、优化的命题与活动。...实战性 网络攻击具有突发性、隐蔽性、潜伏性、持续性等特点,安全运营也需要保证良好的网络安全攻防状态,有应对经验和攻防能力储备。...因此,网络安全运营能力建设通应坚持“事先防范、事中控制、事后处置”的理念,以安全治理为核心、风险态势为导向、安全合规为基础,结合组织基础安全能力,在人、技术、过程层面不断完善组织网络安全体系,满足安全运营的系统性...组织的IT系统依存的基础设施,物理环境从传统的自建,到公共IDC的租赁,硬件基础设施从传统的服务器网络设备、存储到私有云建设,进一步延伸到公有云以及混合云的架构,IT系统从原来的业务功能模块化架构逐渐过渡到互联网企业的解决方案...攻击者会将关键文件进行打包加密甚至隐写,所有的网络会话也会在加密通道上传输,而会话维持以及远程控制服务器的通信会夹杂在代理、V**隧道、NTP、DNS等正常网络协议中混淆视听。

2.6K30

海量服务器运营平台的进化之路

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络服务器行业动态信息,同时分享腾讯在网络服务器领域,规划、运营、研发、服务等层面的实战干货...网络平台部以构建敏捷、弹性、低成本的业界领先海量互联网云计算服务平台,为支撑腾讯公司业务持续发展,为业务建立竞争优势、构建行业健康生态而持续贡献价值!...因此,服务器运营平台的目标是实现服务器技术/运营/服务的平台化管理,向下跨平台跨厂商整合服务器底层技术、中间层依托平台提供的自动化运营流程和数据管理支撑服务器资源管理和稳定运营、向上为公司内的各业务部门提供统一的服务器运营管控服务...更为细致的采集 项为了支持业务运营和监控需求,不仅采集传统的静态配置信息、CPU/内存/硬盘/网络等利用率信息、系统运行日志信息,还需要采集服务器的Eventlog/SDR/SMART等信息。...除了常规的部署系统、带外系统之外,还可以考虑把网络访问/跨平台设备控制/信息安全传输等基础能力整合起来,向用户提供定制化的、底层透明的远程管控服务(参见鹅厂网事-海量服务器安全高效管控系统设计)。

1.9K60

IHS Infonetics:网络运营商进军SDN

根据市场研究机构IHS Infonetics最新调查显示:网络运营商作为网络革命的先驱,毅然决然地进军软件定义网络(SDN)。...去年运营商们已经针对SDN成功进行了实地测验和一些商业部署,在2015年,SDN将继续朝着完成更多的商业部署发展,当然,运营商们仍然要在资源有限的基础上,在自己的现网中实施一两个案例进行SDN测试。...随着运营商试图商业化部署SDN的时候,各种障碍变得越来越显著。根据今年的调查显示:SDN与现网融合、不成熟的技术和产品是目前两个最大的障碍。...运营商希望SDN能够占据他们大部分地区的网络,该网络能够向客户提供云服务以及允许企业对数据中心进行访问。 运营商开始只对部分网络部署SDN,部署过程中并没有很大的障碍。...IHS的研究获得来自全球28个服务提供商的反馈:正在评估并且部署SDN网络或者正在计划这样做。

82750

数据驱动光网络的智能运营探索

我们从标准结构着手,通过科学有效的方法,提升标准结构的高质量运行能力,一旦为标准结构构建起这样的能力,便可以快速将这种能力复制到整个网络。...传送平面的硬件和光纤是运营过程中可以操作的基本单元,构建针对硬件和光纤的感知能力,准确感知故障和潜在风险,触发相关运维操作,对问题硬件替换,避免故障发生,可以将故障转化为计划内的网络操作,保证系统质量。...同时降低计算能力受限的设备的计算负荷,将广泛分布于网络中的设备,改造成网络运行数据采集单元,持续快速的向控制器推送网络的实时运行数据,由控制器完成基于全局视角的系统分析和控制。 ?         ...在有效解决光网络系统问题的同时,更通用的算法,也可以更加便捷的应用到其他网络领域中。 欢迎关注公众帐号“鹅厂网事”,我们给你提供最新的行业动态信息、腾讯网络最接地气的干货分享。...鹅厂网事 分享鹅厂网络的那些事 扫码关注!解锁更多~

79820

谈谈服务器运营领域的机器学习

Samwong(王镇),2011年加入腾讯网络平台部。一直专注于服务器故障发现、运营流程系统的设计与开发。...一般来说,服务器经过三到四年的运行后,都会出现各种各样的异常或故障。因为成本原因,不能强制业务进行服务器更换,如何保障业务在老服务器上能正常运营,成为了服务器运营团队的头等大事。...从2013年开始,网平的大数据如火如荼的开展起来,把所有基础架构,包括服务器网络的数据都统一通过自研的接入平台,往TDW里送。这个是数据平台建立的第一步—收拢数据。...2)特性指标只有10来个,用神经网络体现不出多大优势。 3)LR也尝试过,但效果对比SVM还是差了一些。...三、服务器运营的AI铁三角 经过多年的积累,除了开发能力的提升外,在业务方面,我们形成了服务器运营AI的铁三角,这三个领域,也代表了精细化运营的方向。

1.7K80

大数据在服务器运营中的应用

腾讯公司从2012年开始,通过对服务器运营流程、工具系统的建设,服务器从一线到三线的运营基本转入线上自动化。...运营系统架构 对于海量服务器的管理,我们建立了一套功能强大的运营分析系统,从服务器的带内和带外收集了全面的静态属性和动态运行数据,对服务器的每个关节进行的全方位的数据采集和监控。...根据公司服务器运营的特点,我们在以下四个场景做了大数据的分析和应用,给实际的运营带来的实实在在的好处。...其实这里要说的就是,目前这个阶段,依靠大数据来指导服务器运营,不靠谱,服务器运营智能化远远没有达到。这里还是要靠运营和开发人员的思维和头脑,把自动化运营先做好。...腾讯有大量的服务器运营数据,非常希望可以跟业界一起在数据、资源、算法等各个维度可以共享,寻求更多提高运营效率的途径。

1.3K100

大数据在服务器运营中的应用

前言 腾讯公司从2012年开始,通过对服务器运营流程、工具系统的建设,服务器从一线到三线的运营基本转入线上自动化。...1、 运营系统架构 对于海量服务器的管理,我们建立了一套功能强大的运营分析系统,从服务器的带内和带外收集了全面的静态属性和动态运行数据,对服务器的每个关节进行的全方位的数据采集和监控。...根据公司服务器运营的特点,我们在以下四个场景做了大数据的分析和应用,给实际的运营带来的实实在在的好处。...其实这里要说的就是,目前这个阶段,依靠大数据来指导服务器运营,不靠谱,服务器运营智能化远远没有达到。这里还是要靠运营和开发人员的思维和头脑,把自动化运营先做好。...腾讯有大量的服务器运营数据,非常希望可以跟业界一起在数据、资源、算法等各个维度可以共享,寻求更多提高运营效率的途径。

1.3K70

何维兵:大型DCI网络智能运营实践

运营的同学,都有同样的感受,既希望被老板关注,又不希望被老板关注!因为觉得被老板关注时,常常是没什么好事发生。记得微信红包兴起时,有一次我们网络运营就有幸得到了老板的特别关注!...那我们就像,干脆我们就从业务的角度监控,我们就拿机房的海量服务器去做这样的事情。 其实很简单,就是选取一部分机器作为探测对象,然后机器之间交叉探测。...以上是我们在智能运营这一块比较简单的尝试和思考,这里没有什么方法论和算法的东西,就是我们平时在做的事情以及思考。 这两年,除了探索网络的AIOps外,我们也在同步探索网络运营体系的演进。...因此我们在内部开始推行网络领域的NRE运营体系,就是用软件工程师转型做网络运营工作,这个工作我们已经试行了将近一年的时间,现在我们招聘的毕业生都是研发出生的,对他们进行必要的网络知识的培养,由他们按照软件工程的思路去管理网络...我们认为传统的网工将逐步消失,NRE的新型运营模式将开启网络运营的新时代! ?

1.1K30

网站运营维护中需要用到什么服务器 运营维护还需要哪些

对于市面上的很多网站来说,除了能给它开发出来之外,后期的运营维护也是非常重要的,有不少人都不知道做好一个网站之后后期应该怎样维护,那么网站运营维护中需要用到什么服务器,除此之外要想做好网站的运营维护工作...image.png 网站运营维护中需要用到什么服务器 网站运营维护中需要用到什么服务器?...关于网站运营维护的服务器其实要求不是很高,这毕竟不是在一开始搭建网站的服务器,对于这种服务器来讲,能够实时监测网站的数据就足够了,保证服务器的稳定,在此基础之上挑选性价比更高的服务器最好。...网站运营维护还需要哪些 关于网站运营维护,除了最基本需要服务器之外,还需要很多其他方面的东西。...以上就是关于网站运营维护中需要用到什么服务器的相关内容,在网站运营维护这方面要想做好,可真的要狠下功夫,因为网站维护它关系着网站的整体稳定和安全水平,如果一旦受到攻击或者自身出现bug,就十分容易瘫痪。

2.2K20

为算力护航——腾讯星脉网络运营实践

本文将通过腾讯星脉网络运营体系中的两个系统来介绍腾讯在GPU网络领域的运营实践:a....图10 链路中断视图 图11 链路拥塞视图 集群日常的维护行为如网络变更、隔离,或者服务器维护等操作都有可能引起质量指标的波动,这些波动并不希望被运营人员看见。...对于网络运营来说,业务性能是否受到网络事件影响更加重要。...通过业务流路径识别,将业务流与具体网络链路关联,随后根据业务流健康状态赋予网络拥塞不同等级。由业务触发的拥塞告警为运营人员筛选出有效的异常事件,提高运营效率。...在GPU网络中也有类似的情况,GPU网络架构可以简化地看作是一个clos网络,不同服务器进行通信时,流经过的跳数也是不同的,例如如果源目的服务器在相同的leaf组,也就是block内,那么此时流的跳数就比较少

35810

智慧机场网络安全运营能力体系建设研究

图1.智慧机场网络安全运营能力架构图 从以上图1可以看出,智慧机场网络安全运营能力架构应包括可持续性安全监测、网络空间安全分析预警、快速安全应急响应、新技术新应用安全研究、安全人才培养等五大安全能力,及一系列安全运营管理制度流程构成的安全运营管理体系...四、智慧机场网络安全运营能力构建 综合业界网络安全运营能力现状,以及Gartner提出的自适应安全架构,我们认为:智慧机场网络安全运营能力构建应包括监测、分析、响应、人才培养等五大方面,最终实现“全天候...图2.智慧机场网络安全运营能力图谱 4.1 可持续性安全监测能力 在智慧机场网络安全运营能力建设中,通过合理布设信息采集监测节点,系统地采集网络安全风险管理相关的指标数据,实现对重要安全事件、隐蔽攻击行为...五、智慧机场网络安全运营管理建设 智慧机场网络安全运营管理体系是为能够正常开展既定网络安全运营能力而形成的一系列制度流程等体系文件,以便正确执行日常安全运营协调和管理工作。具体架构参见图3: ?...六、结束语 智慧机场网络安全运营能力体系建设是引领民航机场新技术、新业务场景下网络安全保障进入安全运营时代的重要手段,其能够有效监测、分析、处置日益复杂隐蔽的网络安全攻击和威胁行为,为民航机场重要业务运行而构建综合安全保障能力

1K10

网络安全运营能力建设思路:技术能力建设

本系列文章共分为五篇,本文接上一篇文章,如欲了解前情,可点击以下链接进行回顾: 第一篇 网络安全运营的驱动力以及整体架构设计 四、技术能力建设 安全技术能力建设工作并非从零开始,而是以组织基础设施安全建设为基础...4.3 EDR 端点(PC、服务器、移动设备和嵌入式设备等)作为构建信息化网络的基本组成单元和重要元素,具有部署范围广、使用数量多、承担业务功能多样、存储重要信息数据等特点,容易成为攻击的对象。...4.6 攻击溯源 组织的攻击溯源能力是网络安全运营体系的重要组成部分,通过对资产与流量进行分析一定程度上还原攻击者的攻击路径与攻击手法,有助于提高组织主动防御的能力。...后来,实体(Entity)的概念又被引入了UBA技术,并逐步演进成UEBA,其中E更多是指IT资产或设备,包括服务器、终端、网络设备等,通过对它们的行为异常分析可以发现外部或的网络攻击行为。...UEBA可以帮助安全运营团队发现网络中隐藏的、或未知威胁,包括外部攻击和内部威胁;可以自适应动态的环境变化和业务变化;通过异常评分的定量分析,分析全部事件,无需硬编码的阈值,即使表面看起来细微的、慢速的

2.7K20

微博爬虫出错居然还和网络运营商有关

获取到电脑连接 wifi 和我的移动热点时的分别的 公网 ip 和运营商如下: ? 连着房间wifi时我的电脑公网ip ?...连着移动热点时我的电脑公网ip cn 微博登录时,登录页面是 weibo.cn,点击登录按钮后跳转到了 security.weibo.com,大概率不是微博登录的服务器的分发策略拒绝了北京移动而接收了北京联通...,毕竟用户量那么大,我怀疑是微博对某些 IP 频段的微博爬虫作了限制,具体哪些,我也不知道,所以遇到 cn 微博站无法登录时,或者换个网络就好了。...通常出现这种情况的宽带是非电信、联通的(拐着弯说移动),分两种 case: IP 库没有及时更新,此时应该你电脑获得的 IP 地址和网站获得的 IP 总是一致的(最好不用带 CDN 的网站,那些一般 CDN 服务器和你同运营商就无法准确判断...,比如 IP138 这类就不行) 小宽带运营商,移动(铁通)也在此列,由于众所周知的原因目前很多国内资源都存放在电信\联通的网络中,小宽带运营商不可避免的需要和它们互联互通,同时因为处于弱势地位一定是小宽带运营商交钱给电信

93840

了解一下跨越运营商的网络

图片跨越运营商的网络包通常是指从一个运营商的网络传输到另一个运营商的网络中的数据包。...BGP允许不同运营商之间交换网络前缀的路由信息,从而实现跨越运营商的网络连通性。...与公司网络中自动更新路由表机制的区别: 与公司网络中自动更新路由表机制不同,跨越运营商的网络包需要依赖运营商之间的BGP路由信息交换来更新路由表。...IX的存在的重要性在于减少运营商之间的网络延迟和网络成本,并提高整个互联网的可用性和性能。...运营商如何通过IX互相连接: 运营商可以通过在IX上部署路由器,并与其他运营商建立物理和逻辑连接来实现互相连接。在IX上,运营商可以使用BGP来交换路由信息,从而建立起跨越运营商的网络连通性。

24351
领券