首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【问底】夏俊:深入网站服务端技术(一)——网站并发的问题

本文来自拥有十年IT从业经验、擅长网站架构设计、Web前端技术以及Java企业级开发的夏俊,此文也是《关于大型网站技术演进的思考》系列文章的最新出炉内容,首发于CSDN,各位技术人员不容错过。 以下为正文: 一、引子 《关于大型网站技术演进的思考》已经连载完了两个系列,它们分别是《存储的瓶颈》和《网站静态化的处理》,这两个系列对应到网站里的组件就是存储端和浏览器端,网站除了这两端外,还有一端那就是服务端了,服务端上接浏览器端,下承存储端,所以当我们想让网站的浏览器端或存储端性能更加优秀的时候,就不得不去考虑

08

【SEDA异步框架】【一】SEDA国内外研究现状

1、SEDA架构的起源和特点    当前最流行的互联网服务器模型基本都是基于多线程/进程并发服务模型。然而当线程数目增加到一定值后,系统性能会下降,这就限制了系统支持高并发请求的能力。这种缺陷是多线程/进程本身的架构造成的。加州大学伯克利分校的Matt Welsh提出了一种新的服务器软件架构SEDA。SEDA是Staged Event-Driven Architecture的 缩略语,其基本原理是:应用程序被构造为阶段网络,阶段之间靠事件队列联系,应用程序设计者只负责每个阶段的服务逻辑和阶段间的连接逻辑,而由各阶段自身 负责资源管理和负载适应功能。使用这种分解使系统达到高并发性、高效率性、对负载变化的良好适应性以及良好的系统缩放性。

05

多线程让可扩展性走进了死胡同

这是一篇来自Python世界的文章,但是对整个编程领域还是适用的,多线程虽然让我们处理请求更快,但是也是有天花板的,绿色(微线程micro-thread)线程之类才是解决方案。 多线程软件开发解决了大量的问题,尤其是以网络为中心的应用程序,这些程序需要严苛的性能快速响应用户。不幸的是,多线程并不足以解决大规模并发性的问题。 解决这些问题需要改变编程模型,使用异步事件和基于回调机制。在Druva,我们创建了一个基于python库的名为Dhaga来解决大规模并发,而编程模型不需要重大改变。 软件开发人员生活在一个并发的世界。线程如今是一等公民,今天在开发过程中,特别是当您的应用程序执行密集的网络运营,如同Druva一样的inSync系统(网络安全同步产品)。多线程帮助网络操作的编程代码流变得简单和顺序。当我们的应用程序需要增强的性能或改善其可伸缩性,我们可以增加线程的数量。 但是当需要成千上万规模的并发请求,线程是不够的。 我们发现多线程使用有以下缺点: 1. inSync系统客户端需要大量的文件通过网络RPC调用备份到服务器。开发人员加快速度的典型方法是使用线程。但多线程带来的性能却增加内存和CPU的使用成本;开发人员需要在速度和线程数之间保持一个平衡。 2.我们的服务器需要处理inSync系统与成千上万的客户之间并发连接和通知。为了有效地处理连接,我们使用线程来处理请求。但inSync系统客户的不断增加也意味着我们不得不继续增加线程的数量,从而消耗大量服务器的内存和CPU。 3.我们的Web服务器需要处理成千上万的平行的HTTP请求。大部分工作是在接收和发送的数据网络套接字并将其传给inSync系统的后端。导致大多数的线程等待网络操作。导致C10K问题,当有成千上万的同步请求到Web服务器,为每个请求生成一个线程是相当不可扩展的(Scale)。 异步框架的限制 许多异步框架,包括 Twisted扭曲、Tornado龙卷风和asyncore可以帮助开发人员远离使用线程的流行的方式。这些框架依赖非阻塞套接字和回调机制(类似Node.js)。如果我们按原样使用这些框架,我们Druva代码的主要部分必须重构。这不是我们想要做的事。重构代码会增加开发和测试周期,从而阻止我们达到规模要求。鉴于产品的多个部分需要大规模,我们每个人将不得不重构他们——因此增加一倍或两倍的努力。 为了避免改变如此多的代码,我们不得不离开直接使用现有的框架。幸运的是,我们发现一些有用的工具。 因为我们想要控制在网络I / O的代码执行,我们需要一种将一个线程划分为微线程micro-thread的方法。我们发现greenlets。它提供一种非隐式的微线程调度,称为co-routine协程。换句话说。当你想控制你的代码运行时它非常有用。您可以构建自定义计划的微线程,因为你可以控制greenlets什么时候yield暂停。这对我们来说是完美的,因为它给了我们完全控制我们的代码的调度。 Tornado是一个用Python编写的简单的、非阻塞的Web服务器框架,旨在处理成千上万的异步请求。我们使用它的核心组件,IOLoop IOStream。IOLoop是一个非阻塞套接字I / O事件循环;它使用epoll(在Linux上)或队列(BSD和Mac OS X),如果他们是可用的,否则选择()(在Windows上)。IOStream提供方便包装等非阻塞套接字读和写。我们委托所有套接字操作给Tornado,然后使用回调触发代码操作完成(banq注:非常类似Node.js机制)。 这是一个好的开始,但我们需要更多。如果我们在我们的代码中直接用上面的模块,我们大量的RPC代码将不得不改变,通过greenlets调度RPC,确保greenlets不要阻塞(如果greenlets堵塞,它会堵塞整个线程和其他全部),处理来自tornado的回调功能。 我们需要一个抽象来管理和安排greenlets 以避免让它被外部调用堵塞,这个抽象能够超越线程达到大规模可扩展。这个抽象是Dhaga,它能让应用代码流编程起来像传统同步顺序,但是执行是异步的。 Dhaga(来自印地语,这意味着线程)是我们抽象的一个轻量级线程的执行框架。Dhaga类是来源于greenlet,使用堆栈切换在一个操作系统线程中执行多个代码流。一个操作系统的线程中使用协作调度执行多个dhagas。每当一段dhaga等待时(主要是等待一个RPC调用返回),它yield控制权给父一级(也就是说,是创建它的操作系统级别线程的执行上下文)。然后父一级会调度安排的另一个dhaga准备运行。RPC调用将传递给tornado web服务器异步写入Socket,然后在其返回时注册一个回调,当这个RPC返回时,正在等待的dhaga将被添加到可运行队列中,然后后被父线程拾起。(banq注:类似node.js原理) 我们可以使用Dhaga代替线程

03

Netty学习之线程模型基本介绍

现如今,我们使用通用的应用程序或库来相互通信。例如,我们经常使用HTTP客户端库从服务器上获取信息并通过web服务执行远程过程调用。但是,通用协议或它的实现有时并不能很好的伸缩。这就像我们不会使用通用HTTP服务器来交换大文件、电子邮件、还有像金融信息、游戏数据等实时信息。这些业务所需要的是高度优化实现协议,用于专门的目的。例如,您可能希望实现一个针对基于ajax的聊天应用程序、媒体流应用、大文件传输进行优化的http服务器。您甚至可能想要设计并实现一个完全符合您的需求的新协议。另一个不可避免的情况是,你不得不去处理一个遗留的专有协议,来保证和旧系统的互操作性。在这些情况下,重要的是在不牺牲最终应用程序的稳定性和性能的前提前,如何尽可能快的实现该协议。

02
领券