仅用8个虚拟机，PayPal是如何扩展至日处理数十亿事务的

CSDN技术头条

发布于 2018-02-12 14:44:19

1.5K0

发布于 2018-02-12 14:44:19

文章被收录于专栏：CSDN技术头条

仅在8台虚拟机上，就实现了原本需要100台虚拟机才能实现的工作。甚至当CPU占用高达90%时仍能快速响应，这种Paypal前所未见的事务处理密度，却仅需之前十分之一的时间。在降低成本的同时，还考虑到了无需增加相应的计算基础架构就能获得企业成长——Paypal日处理数十亿事务的系统是如何打造出来的？

Paypal已经迁移至基于Akka框架的Actor模型上，在《squbs：Paypal构建应用的全新响应式方法》一文中，Paypal讲述了整个演变经历，目前他们对squbs进行了开源，点击这里便可查看源码。

在选择项目需采用的实现方式时，我们对有状态服务的考虑还是不够。想要了解更多关于有状态服务的内容，请参考基于Caitie McCaffrey的精彩演讲所撰写的这篇文章《如今构建可扩展有状态服务的案例》，如果还不够令人信服的话，我们可以看看这个案例：《Facebook斥资190亿美元收购WhatsApp的架构》，其中WhatsApp使用Erlang（Akka的竞品）达成了惊人的吞吐量。

本文推荐这两篇的文章的原因在于，Paypal的文章在架构细节上并未提及太多，大多是在他们选择Akka的原因，以及迁移到Akka上的好处。不过，在激励我们不甘于现状、勇于创新方面，这篇文章仍是很有价值的案例。

采用很多虚拟机来提供服务的方案到底有什么问题呢？

提供服务时使用的虚拟机规模很小，每台虚拟机的吞吐量也很低：基于Actor的反应系统在有效地利用计算资源方面非常出色，因此我们可以缩减系统规模，而无需依赖于典型粗暴的自动缩放机制。
对网络和路由选择架构造成很大压力：随着各项服务趋于互联化，请求经过重重传递之后会造成延迟增加、用户体验下降的后果。
规模越大，成本越高昂：由数百台虚拟机联合提供的服务，由于管理、监控以及无效缓存的问题，势必会造成昂贵的开销。
规模越小，敏捷性越高：跨越数百台虚拟机部署服务需要花费很长的时间。
每台虚拟机的CPU利用率更高：由于CPU的处理速度不会增加，所采用的架构需要提高虚拟机CPU的利用率。
需要在松散耦合、易于维护和可快速构建的超微服务（nanoservice）基础上建立起微服务：我们不希望结构体系层层叠叠过于复杂，而是需要对服务所做的工作有清晰的可见性，在了解服务功用时无需深入到深层代码之中。

考虑到以上因素，PayPal需要的系统应当拥有如下特质：