首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯干货沙龙-海量实践大曝光 (三)

作者丨周小军,腾讯SNG资深工程师,负责社交产品分布式存储的及团队管理工作。对互联网网站架构、数据中心、计算及自动化等领域有深入研究和理解。...12月16日,首期沙龙“海量实践大曝光”在腾讯大厦圆满举行。...根据运营指标,按历史性能数据、容量模型和业务架构,评估出春节活动需要2万台虚拟机和3千台数据库服务器扩容支撑。 节前恰好遇到厂商内存供货问题,服务器供应非常紧张,采购比原计划延期了一个多月。...织云高效的实践是,它是以标准化为基石,以 CMDB 为核心的自动化平台。通过 Web 界面的一键式上,基于业务原子任务和流程引擎,形成一个完整的流程,最后并行执行。...相关文章 腾讯干货沙龙-海量实践大曝光 (一) 腾讯干货沙龙-海量实践大曝光 (二) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

4.8K10

腾讯干货沙龙-海量实践大曝光 (二)

作者丨魏旸:腾讯高级工程师,具有15年经验的专家。负责QQ空间、微云、QQ空间相册等的工作。 12月16日,首期沙龙“海量实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。...一个SET内几十个模块,几百台服务器可在10分钟内完成自动化部署上线 。 SET的监控 针对SET内不同的业务架构,业务形态,我们也开发了配套的监控工具。...[图片] [图片] 相关文章 腾讯干货沙龙-海量实践大曝光 (一) 腾讯干货沙龙-海量实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

8.3K10
您找到你想要的搜索结果了吗?
是的
没有找到

腾讯干货沙龙-海量实践大曝光 (一)

作者丨郭智文:腾讯高级工程师,手机QQ负责人。...12月16日,首期沙龙“海量实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。...业务同事通过腾讯网络中心联系到重庆联通网络负责人,经过多轮沟之后,确认确实是运营商在凌晨时段割接网络引起,运营商与厂商经过两次调整最后故障才得以解决。...总结 相关文章 腾讯干货沙龙-海量实践大曝光 (二) 腾讯干货沙龙-海量实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com

4.9K30

原生背景转型之 SRE 实践

作者:yorkoliu,腾讯 IEG 业务专家 一、前言 上一篇文章《原生背景下的价值思考与实践(上)》 重点介绍了原生背景下转型的思考,围绕着整个 DevOps 交付链,贴近业务不断输出运的能力与价值...本文的出发点也是站在巨人肩膀之上,结合自身业务服务场景,思考在原生背景下,转型还有多少种可能性,本文或许只给出其中一种答案吧。...▫ 定制 SRE 准则  在实践 SRE 过程中,我们总结并提炼了“SRE 8 准则”,来指导我们的日常工作。...以上问题亟待建立全新的监控机制,帮助开发/人员全面洞察系统运行状态,并在系统异常时帮助其快速定位解决问题,原生可观测性基础设施应运而生。...o 个人著作:《python 自动化:技术与实践》、《循序渐进学 Docker》、《第一次使用 Docker 就上手》、《破解数据治理之谜》等,个人发明专利 12 个。

2.2K20

FreeWheel 环境治理实践体系设计

计算正在影响整个信息产业,其可靠性、灵活性、按需计费的高性价比等优势已经让很多厂商把“上”列入到了战略计划中。 相对传统计算为我们节省了很多硬件、网络、甚至一些基础服务的维护成本。...自动化: 服务树的设计理念为实现统一的、标准的自动化平台打下了坚实的基础, 例如上述的命名标准,访问控制都是自动化平台里不可或缺的部分。...安全性:保障修改后的代码平稳应用到线上 准确性,利用自动化平台结合 TF 的 Dry run 功能保证用户提交代码的准确性,包括语法和预定义的语义检查,以及提交资源修改前的二次确认: 平台支持暂存当前工作目录状态...,便于执行 TF dry run 和不合法修改再编辑等功能; 平台根据我们的最佳实践定义了一些语义检查规则,补足了 TF dry run 无法实现的一些检查点。...下一篇文章,我们将重点介绍 FreeWheel 在标准化过程中的实践,以及平台如何发挥它的作用。

40120

张戎:腾讯智能(AIOps)项目实践

11月9日,腾讯开发者社区技术沙龙“高效智能”圆满落幕。...本期沙龙围绕展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务的技术实践干货,同时带来腾讯海量业务自研上实践,推动传统转型...讲师介绍:张戎,腾讯高级研究员,新加坡国立大学数学博士,毕业后加入腾讯从事机器学习相关工作。目前主要致力于智能方向的研究,包括时间序列异常检测,时间序列预测,根因分析,告警收敛等方向。...幻灯片3.PNG 今天讲的内容主要是智能方面的一些应用和实践。主要包括智能场景描述、单时间序列分析、多维时间系列分析、近期工作和未来的研究方向。...这个应该是所有人做智能的第一步,其实我们这一块是海量的时间序列和场景,包括各种各样的服务器数据和各种各样的业务器数据。

3.9K54

服务器

服务器是一个互联网公司的“心脏”服务器里存储着公司所有数据,网民访问公司网站,了解公司相关产品,相关介绍都是通过服务器进入的,而做为一个服务器每天需要做的事情有: 1.服务器内存是否已满 2.磁盘空间是否足够...如果每个人需要管理100台服务器,还是传统的认为检测监控去管理,相信每个人都会抓狂的,还好现在又可以替代的管理面板,比如说帮手,它的功能具体有: 1.批量管理多台主机; 2.兼容性强大,...兼容市面基本所有的主机,兼容操作系统; 3.操作简单,可视化界面预览资源、一键修复、一键部署; 4....可以远程登录主机FTP桌面,处理主机上的文件; 5.监控和,资源还有告警功能,这个是挺好的,不用盯着看; 6.系统修复功能,这个是挺实用也比较必须的; 7.免费使用。...总得来说功能还是挺全的,不存在需要又要另外找软件的尴尬,一个帮手软件基本满足了所有需求。

3.3K20

​Ansible技术实践

一、引言随着企业业务的快速发展,高效的管理成为了保障业务稳定运行的关键因素。Ansible作为一款开源的自动化工具,在运领域受到了广泛的关注和应用。...本文将深入探讨Ansible的技术原理、应用场景及实践案例,并结合代码示例进行详细讲解。希望读者能够通过本文,更全面地了解Ansible技术,并能在实际工作中加以应用。...二、Ansible简介Ansible是一款基于Python开发的开源自动化工具,采用简单易懂的YAML语法,能够实现对服务器、网络设备、应用程序等的自动化配置、部署、监控及管理。...配置管理:使用Ansible对服务器、网络设备等进行统一配置管理,确保配置的一致性和合规性,降低成本。...跨平台支持也有助于统一不同团队的流程,提高企业的水平。

18500

探讨】RPA落地实践,提升IT工作效能!

RPA应用于实践 RPA在运的地位 在各行业企业中,近几年已经在逐步建设或已经建设了管理平台,而RPA技术作为管理的基础功能,在IT业务巡检领域里应用得越来越广,并且越来越显现出其RPA的优势...RPA在IT的应用场景 1、服务器和应用程序监控 对每个IT部门来说,服务器崩溃、停机都是噩梦般的存在。任何一次意外停机或崩溃,都可导致数据丢失、作业停止,从而给企业带来重大收入损失。...场景流程梳理 以下以某流程为例,要想通过RPA来实现,先从使用者用户的角度详细梳理整体操作步骤,形成流程图,这个步骤的过程需细化到最小的操作单元,例如点击选取某个下拉框、点击某个按钮、在某个对话框输入指定内容等...总结 总体来看,RPA的技术的诞生突破了用户侧个性化操作而又难以模拟的技术壁垒,对于乐于对新技术的探索和采用的IT人员,尤其人员,更是一大福音,对于繁杂、重复、低效的低技术的操作,RPA一一解决...,人员也从中释放出大量的时间。

2.1K213183

游族网络总监:如何千台以上游戏服务器

作者:李志勇 来源: http://www.csdn.net/article/2016-03-21/2826611 偶然在网上看到游族网络总监李志勇先生进行的一次分享,作为一个人,对其中的思想赞叹不已...本次分享主题为“如何千台以上游戏服务器”。重点是时代的,包括游戏上部署整体方案、游戏服务器批量管理,并对企业选择RDS还是自建MySQL数据库给出了自己建议。...该架构方案效率更高,可实现秒级开服同时具备业务高可用特性。 基于第二代架构,游族基于OpenStack自己的私有,最初目标是为了提高服务器利用率、降低成本和实现分钟级开服。...方式的转变 与三代架构相互对应是游族的三个阶段: 在第一代架构上,基本是手工运,技术含量并不高,纯粹是采用人与时间堆积进行,同学需要登录每一台服务器,顺序执行相关的命令和脚本。...独立的版控服务器,通过主动推送的形式进行版本更新; 在第二代架构上,通过自动化工具进行批量,团队推出了使用expect写的auto批量脚本,所有操作只需登录一台集控服务器执行批量并发操作的脚本,独立的版控服务器

8.6K80

原生背景下的价值思考与实践

的服务大量采用了原生的应用与技术架构,作为公司第一批面临原生环境的业务,深切感受到原生给工作带来的机遇与挑战,模式的转型已经迫在眉睫,此篇文章最大的价值在于将我们的转型思路、方法与实践...三、原生转型、挑战、目标与实践 1、原生转型思维 这几年运界听到最多的几句话:“计算会淘汰掉!整个行业可能被干掉!再不转换就要丢饭碗”,诸如此类。那真相到底是什么?...2、原生转型平台化建设 在运平台化建设方面,我们在构建原平台能力–玄图。...五、总结 原生给体系带来的是挑战更是机遇,如何在这波计算浪潮中,寻找的定位与价值,我想是每一位人应该思考的问题。...热衷开源技术的研究,包括大数据资产管理及原生等领域,擅长大数据治理,数据与业务中台建设、海量与规划等工作,曾出版个人著作《python自动化:技术与实践》、《循序渐进学Docker》等,个人发明专利

1.6K20

腾讯+,助力领域技术发展

每期沙龙将会邀请腾讯领域专家,分享计算时代的思考和实践,并且为参加沙龙活动的人员提供一定金额的腾讯代金券,帮助大家0门槛体验腾讯上各类产品,而针对企业用户,腾讯+创业”计划更是能给出高达百万的资扶持...六个主题覆盖的质量、效率、成本、规划、DevOps与AI的相关话题,将独家曝光大量实践的案例。...,以2天部署2万台服务器的量化能力开场,以社交业务的节假日活动准备为背景,给大家介绍了SNG自动化的技术与容量压测技术,并从发展的角度提出了团队的价值论,引起了与会者的共鸣与思考。...后续的海量实践效率与自动化,监控与质量,运营成本与规划,DevOps实践主题,AI等主题进行分享,敬请期待。...(一) 海量实践大曝光 (二) 海量实践大曝光 (三)

4.8K10

Zookeeper实践经验

常用参数 tickTime:CS通信心跳数 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。tickTime以毫秒为单位。...initLimit:LF初始通信时限 集群中的follower服务器(F)与leader服务器(L)之间初始连接时能容忍的最多心跳数(tickTime的数量)。...syncLimit:LF同步通信时限 集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(tickTime的数量)。...服务器权重的默认值是1。如果配置文件中定义了组,但是没有权重,那么所有服务器的权重将会赋值为1。经过实际测试和翻阅zk的投票源码,Weight等于0的节点不参与投票,没有被选举权。...在弹出的界面选择“远程进程”,输入“服务器IP:9991”(zookeeper服务器的IP和端口) 实践经验 分Group 要确保Zookeeper整个集群可靠运行,就是要确保投票集群可靠。

1.1K30

MongoDB 常用实践总结

1、集群组件的介绍 mongos(路由处理):作为Client与MongoDB集群的请求入口,所有用户请求都会透过Mongos协调,它会将数据请求发到对应的Shard(mongod)服务器上,再将数据合并后回传给用户...replica set(副本集):副本集实现了数据库高可用,若没做副本集,则一旦存放数据的服务器节点挂掉,数据就丢失了,相反若配置了副本集,则同样的数据会保存在副本服务器中(副本节点),一般副本集包含了一个主节点与多个副本节点...arbiter(仲裁节点):仲裁服务器本身不包含数据,仅能在主节点故障时,检测所有副本服务器并选举出新的主节点,其实现方式是通过主节点、副本节点、仲裁服务器之间的心跳(Heart beat)实现。...高伸缩性的场景:非常适合由数十或者数百台服务器组成的数据库。 用于对象及JSON数据的存储:MongoDB的BSON数据格式非常适合文档格式化的存储及查询。...说明:通过此命令,可以查看操作数量、内存使用状况、网络io等 db.runCommand( { serverStatus: 1 } ); 3、检查复制集成员状态 rs.status(); 三、基本的操作

2K11

腾讯ES:日志轻接入和免最佳实践

本文将从日志的生命周期开始,分析业界最成熟的ELKB解决方案在接入时和接入后的痛点,并通过在腾讯ES上接入日志和索引的体验,分享腾讯ES是如何解决这些痛点,来降低日志接入和成本,让业务能专注于日志数据价值的挖掘...——既然自建和上都需要业务打通复杂的链路,也需要优化和ES索引,上有什么优势呢?...* 日志采集场景,支持服务器CVM、容器服务TKE中业务产生的日志,以及防火墙、Web应用防火墙等产品产生的日志,并且在不断丰富其他产品日志的接入。...但事实上,从我们大量的线上运营与实践经验看,的工作远没有结束,随着日志的不断写入,问题也随之而来,而这些问题让头发本就稀疏的程序员雪上加霜。如何定义和创建索引?...针对上面的使用和痛点,腾讯ES提供了独家的索引管理解决方案——自治索引。顾名思义,自治索引是一种能够自的索引,在ES原生索引增删改查能力的基础上,提升了易用性和免能力。

1.1K60

自动化之殇 | 高效最佳实践05

再往后有了私有,公有,部署方式又发生变化,这时候面对的层次不一样,部署包也不一样,以前的war包,rpm包,现在到了IaaS层,都变成了image,虽然部署简单了,但考虑的问题更多了,怎么管理image...诚如前文所说,这个层次的自动化只部分解决了手工执行的问题,但一旦操作的条件发生了变化,可能Shell脚本也得变,的压力还是很大,而且容易出错。管理的服务器越多,出错的概率越大得多。...我们来看一下腾讯游戏基于此的最佳实践。 腾讯游戏在底层设计并封装很多原子件,这些原子件可被多次调用。例如原子件“DB容量管理”就应用到复合件“数据决策自动缩扩容”、“运营活动自动开关”等。 ?...例如: 是否针对自动化平台的服务器账号做了特殊限制,使得这个账号只能操作指定目录,只能重启Nginx、不能重启PHP?...之前没有自动化,小米加步枪的时代,上千台服务器相对独立,还有各种堡垒机、动态令牌或私钥登录服务器等安全措施,想一个命令删除大批量服务器的程序,还真不容易实现。

2.3K51

智能机器人--AI实践探索【二】

诞生背景 最近这些年,行业提出了不少概念,各种各样的“XX”可以说是你方未唱罢我方已登场。然而,这些概念,都有一个共同点:专注于面向同学自身的工具和系统。...我们专注于场景,借助于AI技术,开发了智能机器人,为的就是缓解这一矛盾。 登场亮相 什么是智能机器人?...另一方面,它不是一个单纯的客服,它还是一个面向同学自己的移动平台。 智能机器人的这样设计,自然是针对场景的特殊性而来。场景最典型的特点有以下三条: • 操作类需求。...所以,定位于场景的机器人,不仅要“说到”,更要“做到”。 • 移动平台。日常运营中,同学会用到一些运营系统或工具。...这一点切合工具定制化强,开发敏捷的特点。而且相比手机APP这个正统的移动平台,智能机器人的移动工具开发门槛低到大多数的同学都能够迈过去。

5.3K61
领券