作者:vivo 互联网服务器团队- Hao Chan随着互联网业务的快速发展,基础设施的可用性也越来越受到业界的关注。内存发生故障的故障率高、频次多、影响大,这些对于上层业务而言都是不能接受的。...然而硬件故障一直以来都是一种普遍存在的现象,由于硬件故障而造成的损失往往是巨大的。在服务器各个部件中,除硬盘故障以外,内存故障是第二大常见的硬件故障类型。...并且服务器内存的数量众多,vivo的内存数量达到40w+条,内存故障造成的最严重的后果是会直接导致系统崩溃,服务器宕机,这些对于上层业务而言都是不能接受的。...我们可以使用APEI Error inject做一些错误注入的测试。...EDAC在vivo服务器全量上线过程以来,累计提前发现450+ case的内存CE问题,服务器的宕机数量明显减少。
公司DHCP服务器一直是安装在域控上,之前做了域控迁移后,需要把DHCP服务同步迁移到server 2019,具体方法如下: 升级迁移域控请挪步 Windows server 2008 R2 AD升级迁移到...备份&迁移 首先在新的DHCP服务器server 2019的C盘路径下新建dhcpdata的文件夹 以管理员身份打开新的DHCP服务器server 2019上的Windows PowerShell,...server 2008) –leases –File C:\dhcpdata\dhcp.xml –verbose 此处可能会遇到无法导出的情况,这时可以到旧服务器上手动进行备份...,然后拷贝文件到新服务器上同样可以 等导出操作成功后,再输入: Import-dhcpserver –computername 计算机名...x65B0;机器server 2016) –leases –File C:\dhcpdata\dhcp.xml –verbose 故障转移高可用
系统级:当前系统可打开的最大数量,通过fs.file-max参数可修改 用户级:指定用户可打开的最大数量,修改/etc/security/limits.conf...
本项目采购满足期为1年,采购规模为4400台。
这是第 2 版《有一台服务器可以做哪些很酷的事情》。...如果想要看看三年前的一些被弃用的服务,你可以移步: 有一台服务器可以做哪些很酷的事情 2019 年的时候,我写过一篇《有一台服务器可以做哪些很酷的事情》(https://www.jxtxzzw.com/...对于我来说,我搞一个云盘主要是有时候需要自己博客加一些附件啥的,全部传在服务器就没地方放,硬盘不够,所以想找一个支持阿里云 OSS 的云盘。...OnlyOffice 的 Document Server 倒是部署了起来,配合 Nextcloud 使用,可以在任何地方登录我的服务器查看 Word、Excel、PowerPoint 的文档并修改,实时保存...私有化部署的 Canvas,用来做 TA,或者帮同学 Mock Interview,整理一些讲解视频和材料,或者是……家教?
这是第 2 版《有一台服务器可以做哪些很酷的事情》。...如果想要看看三年前的一些被弃用的服务,你可以移步:【玩转腾讯云】有一台腾讯云可以用来做什么(https://cloud.tencent.com/developer/article/1617021)2019...年的时候,我写过一篇《有一台服务器可以做哪些很酷的事情》(https://www.jxtxzzw.com/archives/4739)。...对于我来说,我搞一个云盘主要是有时候需要自己博客加一些附件啥的,全部传在服务器就没地方放,硬盘不够,所以想找一个支持阿里云 OSS 的云盘。...私有化部署的 Canvas,用来做 TA,或者帮同学 Mock Interview,整理一些讲解视频和材料,或者是……家教?
前言 知乎上有一个提问:自己拥有一台服务器,可以做哪些很酷的事情? ↓↓↓ 今天,我们就这个话题,一起来做个讨论。...程序员如果想要有一台云服务器,可以蹭厂商(阿里云、腾讯云等)搞活动(比如双十一或618节点,优惠幅度还是挺大的),入手一台。特别是新人,折扣还是挺大的。 那顺利拍下之后,你一般会拿它来做哪些事情呢?...我的回答 我自己之前也是蹭双十一活动节点,从阿里云官网入手了一台低配版的服务器,我会用它来搭建个人博客、部署工作中需要用到的一些软件用来预演等等,感觉还不错。...数据库托管: 服务器可以用于运行数据库服务器,如 MySQL、PostgreSQL、MongoDB 等,以存储和管理数据。...游戏服务器: 如果你对游戏开发感兴趣,可以将多人在线游戏(MMO)或多人游戏服务器部署到服务器上,以供玩家连接和互动。
《Redis设计与实现》读书笔记(二十七) ——Redis哨兵(sentinel)主服务器下线判断与故障转移 (原创内容,转载请注明来源,谢谢) 一、主观下线检测 默认情况下,sentinel会每秒1...三、选举领头sentinel 当一个主服务器被判定为客观下线,监视该主服务器的各个sentinel,会协商选举一个领头sentinel,对下线主服务器进行故障转移工作。...四、故障转移 选举领头后,领头sentinel将进行故障转移,工作包括: 1)在下线的主服务器对应的从服务器里面,重新选一个主服务器; 2)让其余的从服务器都称为新主服务器的从服务器; 3)把下线的旧主服务器也设置为新主服务器的从服务器...8、判断主服务器客观下线后,sentinel会选出一个领头sentinel,来进行故障转移的工作,选举主要是要拿到超过半数的临时领头。...9、故障转移工作,包括从从服务器中新选出一个主服务器、将其他从服务器复制的对象改为新主服务器、将下线的旧主服务器改为从服务器。 ——written by linhxx 2017.09.13
目前云上实现Oracle数据库高可用的技术有:Oracle Rac(单实例)、Rose HA第三方软件(单实例)及Keepalived(单实例)、Data Guard(多实例)。...一、Oracle Rac RAC单个实例,可以实现主备、集群负载功能,其中某一台down机,不影响整体服务,不存在故障切换时间,可以提供高性能服务;存储共享;硬件成本低。...HA双机热备可以提供高可用性,保证业务的持续稳定运行,可以实现自动快速故障转移,存在短暂的切换时间(10-30s),一般用于关键性业务。存储共享。...Keepailived有一台主服务器和多台备份服务器,在主服务器和备份服务器上面部署相同的服务配置,使用一个虚拟IP地址对外提供服务,当主服务器出现故障时,虚拟IP地址会自动漂移到备份服务器。...、报表统计等;主备自由切换,能实现自动快速故障转移;备用角色强制转换为主用角色会破环Data Guard架构;设计复杂、维护难度大。
一 SQLServer高可用集群相关概念 1.1 Windows故障转移群集 Windows故障转移群集是由多个服务器组成的共同提供某高可用服务,该服务用于防止单台服务器故障导致服务失效。...一台服务器接管发生故障的服务器的过程通常称为"故障转移"。 1.2 集群节点 运行着相同Microsoft 群集服务 (MSCS)的一组(相关)服务器。...这样SQL Server 实例依就像运行在单台计算机一样显示在网络中。...通过多个服务器(节点)共享一个或多个磁盘来实现高可用性,故障转移集群在网络中出现的方式就像单台计算机一样,但是具有高可用特性。...这种配置涉及到称为“见证服务器”的第三方服务器实例,它能够使镜像服务器用作热备份服务器。从主体数据库至镜像数据库的故障转移通常要用几秒钟的时间。 数据库镜像可用于做暖备份和热备份。
主要是在业务量和数据量使用频率较高时,单台服务器不足以承担所有的负载压力,那么可以通过负载均衡这种手段,将流量和数据平均到集群中其他服务器上,提高整体的负载处理能力。...以 Nginx 服务为例:需准备两台 Nginx,一台对线上提供服务,另一台做冗余保证高可用,常见的实践是keepalived存活探测,相同虚拟 IP(virtual IP)来提供服务。 ?...自动故障转移:当一台Nginx宕机时,Keepalived能够检测到,会自动的将故障进行转移,使用的是相同的虚拟IP,切换过程对调用方是透明的。 反向代理层 --> 站点层的高可用 ?...故障自动转移:当一台读库宕机时,db-connection-pool 能够检测到,会自动的进行故障转移,将流量自动迁移到其他的读库,整个过程由连接池自动完成,对调用方是透明的,数据库连接池是很重要的基础组件...服务层到数据库写的高可用,是通过写库的冗余来实现,可以设置两台MySQL双主同步,一台对线上提供服务,另一台做冗余以保证高可用,常见的实践是keepalived存活探测,相同虚拟IP(virtual IP
如果单台物理机上的两台虚机做集群,则使用虚拟磁盘。如果两台虚机分布在不同物理主机上,则需使用直通RDM方式挂载共享存储。...根据我们的实际情况,考虑到两节点放在同一物理主机上无法起到故障转移作用,故应选择跨物理主机的集群。...NLB 在为用户提供连续服务的同时还提供了高可用性,即自动检测服务器故障,并在 10 秒内在其余服务器中重新分配客户端流量。 组件负载平衡 组件负载平衡可以在多个运行站点业务逻辑的服务器之间分配负载。...当任一节点(群集中的服务器)发生故障或脱机时,MSCS 将尝试最大程度地减少故障对系统的影响。 MSCS 故障转移功能是通过群集中连接的多个计算机中的冗余实现的,每台计算机都具有独立的故障状态。...为了实现冗余,需要在群集中的多个服务器上安装应用程序。但在任一时刻,应用程序只在一个节点上处于联机状态。当该应用程序出现故障或该服务器停机时,此应用程序将在另一个节点上重新启动。
使用DHCP故障转移 DHCP故障转移是用于确保DHCP服务器的高可用性的功能。...通过DHCP故障转移,两台DHCP服务器共享DHCP信息,因此,如果一台服务器发生故障,另一台服务器仍可以为客户端提供DHCP租约。 DHCP故障转移选项内置在Windows服务器操作系统中。...有两种故障转移设计选项: 热备设计 使用热备用模式时,一台服务器是活动服务器,另一台是备用服务器。活动服务器是主服务器,并处理所有DHCP请求。如果活动服务器关闭,则备用服务器将接管DHCP请求。...如果其中一台服务器与其故障转移伙伴失去联系,它将开始向所有DHCP客户端授予租约。 总结 您将需要确定哪种故障转移设计最适合您的环境。...以下是统计分配静态IP地址时,发生以下情况: Helpdesk替换了不知道设置了静态IP的设备 现在这台设备完全或部分失去网络连接 Helpdesk将故障单发送给网络团队以求解决问题 网络团队把故障单发回
,哨兵负责发送消息作为报警通知给管理员 故障转移:如果master node挂掉,自动转移到slave node上 配置中心:如果故障转移发生,通知客户端新的master地址。...,投票的结果由一个哨兵发起,进行failover[故障转移]操作,切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称之为客观下线 其实主观就是自己认为,客观就是大多数人认为...切换成功,单哨兵 完成 哨兵配置(多哨兵) 关闭刚才的单哨兵控制台 D:ctrl+c 网址:https://www.cnblogs.com/joeymary/p/11492791.html 多哨兵就不写了...sentinel down-after-milliseconds mymaster 30000 #故障转移时,最多可以有多少个slave同时对新的master进行数据同步,该值越小,完成故障转移的时间越长...sentinel parallel-syncs mymaster 1 #故障转移超时时间(毫秒),默认180秒。
如果你想要托管项目,可以考虑 GitLab.com ,在这个网站上我们运行了一个单实例的 GitLab。目前有将近 20000 个用户在使用这个服务。单台机器上有超过 10 万个项目托管之上。...但是由于用户的不断增长,AWS 单实例已经无法满足我们的需要,特别是 CPU 和存储方面的限制。我们必须寻找一种替代解决方案。 10万个仓库需要占用好多个 TB 的存储,因此存储能力至关重要。...And 因此,我们目前采购了两台独立服务器用来运行 GitLab.com,其中一台是活动的主服务器,另外一台备用。...故障以及故障转移 从亚马逊上迁移出来意味着我们不能再利用 AWS 平台的一些特性,因此一旦服务器宕机我们需要一些故障转移的措施。...我们需要使用 DRBD 来创建主从服务器架构,同一时间只有一个应用服务器是活动的,一旦出问题就会让 DRBD 切换到另外一台服务器。 我们的 DRBD 工具可通过 subscribers 获取。
搞服务器 站长最近沉浸在搞服务器的深渊中,无法自拔。经过了无数个被折磨的夜晚,终于摆脱了腾讯云的束缚,自己真正拥有了一台可以做RNA-seq分析服务器。...另外,成本确实相对有点高,虽然掌握生信技能是一个势在必行的事,也应该为此付出一些,但在一脸懵逼的情况下,花个2万买一台自己都不用的机器,无论是理性还是感性消费都是说不过去的,当然土豪可以忽略这些。...其实塔式服务器就是一个大的台式机,其实把塔式服务器直接横过来放到机架上就是机架服务器了。性能和扩展性不用说,只要有钱,塔式服务器你可以配到极致。价格上,在三者之间,稳定性比台式机强很多。...使用云服务器做分析的时候,能使用的最高性能配置就是12核64G+8T的硬盘,至于其他比如显卡:等做深度学习的时候再配也来得及比如SSD:性价比超低,等价钱降下来了再配也来得及比如双路cpu:其实一个就够用了...由于还没有设置RAID做备份盘,这个硬盘真的是不够用啊,但是T630有八个盘位,至少可以装80T,而且支持热插拔,就是插拔自如,不用关机开机箱。欣慰六。
故障转移 如果主服务器失效,则后备服务器应该开始故障转移过程。如果后备服务器失效,则不会有故障转移发生。如果后备服务器可以被重启(即使晚一点),由于可重启恢复的优势,那么恢复处理也能被立即重启。...一旦发生到后备服务器的故障转移,就只有单一的一台服务器在操作。这被称为一种退化状态。之前的后备服务器现在是主服务器,但之前的主服务器处于关闭并且可能一直保持关闭。...因此,从主服务器切换到后备服务器可以很快,但是要求一些时间来重新准备故障转移集群。从主服务器到后备服务器的常规切换是有用的,因为它允许每个系统有常规的关闭时间来进行维护。...这也可以作为一种对故障转移机制的测试,以保证在你需要它时它真地能够工作。我们推荐写一些管理过程来做这些事情。...要触发一台日志传送后备服务器的故障转移,运行pg_ctl promote或者创建一个触发器文件,其文件名和路径由recovery.conf中的trigger_file设置指定。
、ES、微服务都是单节点部署的,没有做集群模式部署,为了提高整体的可用性,对项目的部署架构进行了升级,支持高可用。...搭建 Redis 一主两从的步骤如下: 拷贝和还原 Redis 镜像到三台服务器上。 其中一台服务器作为主节点,配置文件为主节点的,用 docker 启动 Redis 主节点。...五、客户端自动感知故障 如何实现自动感知故障 我们项目中,都是用 Redis 客户端去读写 Redis,在单机情况下,单节点 Redis 宕机后,客户端肯定会报错,我们可以尝试恢复这个服务器上的 Redis...因为故障转移是需要一定时间的,过几秒后后发现控制台窗口打印出 Redis 的主节点为 10.2.1.63:6379,说明故障转移成功了。...七、总结 本篇讲解了在真实的多台服务器上如何部署 Redis 主从架构、哨兵集群,以及验证主从复制和故障转移。
,通过高可用群集实现,默认情况下有一个服务器承载,这台服务器宕机,由另外一台存储服务器继续承载存储控制器,是否更加贴合实际应用了呢,这样的话我们就可以利用这样一套简单存储+Windows群集的架构,来真正的为业务提供存储使用...需要注意的是群集存储空间的概念,与ISCSI target服务器群集的概念不一样,如果我在群集里面提供了ISCSI target角色,那么我实际上是做的存储前端适配器这一层的容错,即是说我对外面用户访问我的...,CSV底层磁盘仍然是保留我们的设置 双端架构上可以选择 前端单台Hyper-V,后端群集存储空间SOFS 前端多台单机Hyper-V,后端群集存储空间SOFS 前端Hyper-V群集,后端单台存储空间...打开故障转移群集管理器管理控制台(cluadmin.msc),在面板左侧,展开“ 存储”,右键单击“ 池”,然后点击“新建存储池” ?...群集虚拟空间,以及群集共享卷,联机上线正常使用,存储控制器配置信息即便转移到另外节点也得到保留 ? 在群集运行中也支持手动故障转移群集存储池 ?
领取专属 10元无门槛券
手把手带您无忧上云