我开始开发一个but服务,它将托管在云中,但需要比典型的云SLA提供的更高的可用性。
典型的SLA,例如Windows,保证了99.9%的可用性,即每月最多43分钟的停机时间。我正在寻找一个数量级更好的可用性(<5分钟下降时间每月)。虽然我可以配置几个负载平衡的数据库后端来解决这部分问题,但我在see服务器上看到了一个瓶颈。如果the服务器失败,整个服务对客户是不可用的。在不引入另一个可能的单一故障点的情况下,降低这种风险的选择是什么?我认为每种方法都有以下解决办法和缺点:
如果有任何最佳实践的线索,我们将不胜感激。
干杯,塞巴斯蒂安
发布于 2014-06-03 10:45:40
实例的可用性,即由云提供程序指定的SLA,意味着“实例的健康是在Hypervisor或Fabric上下文中运行的服务器”。尽管如此,您需要付出努力,确保实例不会失败,因为您的应用程序/ OS /或在实例中运行的几乎任何东西。有几件事情是开发者往往会错过的,而这种回击就像--比如忘记配置操作系统更新和补丁。
具有可用性的基本公理是冗余。您的应用程序/基础结构越冗余,您的应用程序就越可用。
我建议您查看一下Azure Traffic Manager
,然后再对您的体系结构进行重新设计。你不必担心SRV记录或A记录。只要给交通经理做个CNAME就行了。
交通管理的思想很简单,你可以告诉交通经理站在域名(应用的域名解析),然后交通经理决定向哪里发送请求考虑因素,如循环罗宾,灾难管理等。
通过将交通管理器和多区域基础设施设置结合起来,您将朝着高可用性目标迈进。
链接
云力量:如何使用流量管理器在全球范围内扩展Azure网站
发布于 2015-07-30 20:13:04
也许您应该用DRBD配置一个cor产c集群?DRBD将确保复制两个节点上的数据(例如,网站文件和db文件)。Apache作为web服务器将在指向域的虚拟IP下可用。如果一台服务器出现故障,cor产c将在几秒钟内将所有服务移动到第二台服务器。
https://stackoverflow.com/questions/23992343
复制相似问题