首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一篇搞定Nginx功能

引言

一、性能怪兽-Nginx概念深入浅出

二、Nginx环境搭建

三、Nginx反向代理-负载均衡

四、Nginx动静分离

五、Nginx资源压缩

六、Nginx缓冲区

七、Nginx缓存机制

八、Nginx实现IP黑白名单

九、Nginx跨域配置

十、Nginx防盗链设计

十一、Nginx大文件传输配置

十二、Nginx配置SLL证书

十三、Nginx的高可用

十四、Nginx性能优化

十五、放在最后的结尾

引言

早期的业务都是基于单体节点部署,由于前期访问流量不大,因此单体结构也可满足需求,但随着业务增长,流量也越来越大,那么最终单台服务器受到的访问压力也会逐步增高。时间一长,单台服务器性能无法跟上业务增长,就会造成线上频繁宕机的现象发生,最终导致系统瘫痪无法继续处理用户的请求。

从上面的描述中,主要存在两个问题:单体结构的部署方式无法承载日益增长的业务流量。当后端节点宕机后,整个系统会陷入瘫痪,导致整个项目不可用。

因此在这种背景下,引入负载均衡技术可带来的收益:

「系统的高可用:」当某个节点宕机后可以迅速将流量转移至其他节点。

「系统的高性能:」多台服务器共同对外提供服务,为整个系统提供了更高规模的吞吐。

「系统的拓展性:」当业务再次出现增长或萎靡时,可再加入/减少节点,灵活伸缩。

OK~,既然引入负载均衡技术可给我们带来如此巨大的好处,那么又有那些方案可供选择呢?主要有两种负载方案,「「硬件层面与软件层面」」,比较常用的硬件负载器有等,但这些机器动辄大几万乃至几十万的成本,因此一般大型企业会采用该方案,如银行、国企、央企等。而成本有限,但依旧想做负载均衡的项目,那么可在软件层面实现,如典型的等,软件层的负载也是本文的重点,毕竟们的准则之一就是:「「能靠技术实现的就尽量不花钱。」」

当然,如果你认为本文对你而言有帮助,记得点赞、收藏、关注三连噢!

一、性能怪兽-Nginx概念深入浅出

是目前负载均衡技术中的主流方案,几乎绝大部分项目都会使用它,是一个轻量级的高性能反向代理服务器,同时它也是一个通用类型的代理服务器,支持绝大部分协议,如等。

与Redis相同,都是基于多路复用模型构建出的产物,因此它与同样具备「「资源占用少、并发支持高」」的特点,在理论上单节点的同时支持并发连接,而实际生产环境中,硬件基础到位再结合简单调优后确实能达到该数值。

先来看看引入前后,客户端请求处理流程的对比:

原本客户端是直接请求目标服务器,由目标服务器直接完成请求处理工作,但加入后,所有的请求会先经过,再由其进行分发到具体的服务器处理,处理完成后再返回,最后由将最终的响应结果返回给客户端。

了解了的基本概念后,再来快速搭建一下环境,以及了解一些的高级特性,如动静分离、资源压缩、缓存配置、黑名单、高可用保障等。

二、Nginx环境搭建

首先创建的目录并进入:

下载的安装包,可以通过工具上传离线环境包,也可通过命令在线获取安装包:

没有命令的可通过命令安装:

解压的压缩包:

下载并安装所需的依赖库和包:

也可以通过命令一键下载(推荐上面哪种方式):

执行完成后,然后查看目录文件,会看一大堆依赖:

紧接着通过命令依次将依赖包一个个构建,或者通过如下指令一键安装所有依赖包:

进入解压后的目录,然后执行的配置脚本,为后续的安装提前配置好环境,默认位于目录下(可自定义目录):

编译并安装:

最后回到前面的目录,输入即可看见安装完成后生成的文件。

修改安装后生成的目录下的配置文件:

制定配置文件并启动:

其他操作命令:

开放端口,并更新防火墙:

在的浏览器中,直接输入刚刚配置的地址访问:

最终看到如上的欢迎界面,代表安装完成。

三、Nginx反向代理-负载均衡

首先通过快速搭建一个项目:springboot-web-nginx,然后在该项目中,创建一个文件,逻辑如下:

在该类中,存在一个成员变量:,它的值即是从配置文件中获取值。当出现访问资源的请求时,跳转前端页面,并将该值携带返回。

前端的文件代码如下:

从上可以看出其逻辑并不复杂,仅是从响应中获取了输出。

OK~,前提工作准备就绪后,再简单修改一下的配置即可:

至此,所有的前提工作准备就绪,紧接着再启动,然后再启动两个服务,第一个服务启动时,在配置文件中,将端口号改为,第二个服务启动时,将其端口号改为。

最终来看看效果:

因为配置了请求分发的权重,的权重比为,因此请求会根据权重比均摊到每台机器,也就是一次、两次、一次......

Nginx请求分发原理

客户端发出的请求最终会转变为:,然后再向目标发起请求,流程如下:

由于监听了的端口,所以最终该请求会找到进程;

首先会根据配置的规则进行匹配,根据客户端的请求路径,会定位到规则;

然后根据该中配置的会再找到名为的;

最后根据中的配置信息,将请求转发到运行服务的机器处理,由于配置了多个服务,且配置了权重值,因此会依次根据权重比分发请求。

四、Nginx动静分离

动静分离应该是听的次数较多的性能优化方案,那先思考一个问题:「「为什么需要做动静分离呢?它带来的好处是什么?」」其实这个问题也并不难回答,当你搞懂了网站的本质后,自然就理解了动静分离的重要性。先来以淘宝为例分析看看:

当浏览器输入访问淘宝首页时,打开开发者调试工具可以很明显的看到,首页加载会出现的请求数,而正常项目开发时,静态资源一般会放入到目录下:

在项目上线部署时,这些静态资源会一起打成包,那此时思考一个问题:「「假设淘宝也是这样干的,那么首页加载时的请求最终会去到哪儿被处理?」」答案毋庸置疑,首页的所有请求都会来到部署服务的机器处理,那则代表着一个客户端请求淘宝首页,就会对后端服务器造成的并发请求。毫无疑问,这对于后端服务器的压力是尤为巨大的。

但此时不妨分析看看,首页的请求中,是不是至少有是属于这类静态资源的请求呢?答案是。

既然有这么多请求属于静态的,这些资源大概率情况下,长时间也不会出现变动,那为何还要让这些请求到后端再处理呢?能不能在此之前就提前处理掉?当然,因此经过分析之后能够明确一点:「「做了动静分离之后,至少能够让后端服务减少一半以上的并发量。」」到此时大家应该明白了动静分离能够带来的性能收益究竟有多大。

OK~,搞清楚动静分离的必要性之后,如何实现动静分离呢?其实非常简单,实战看看。

先在部署的机器,目录下创建一个目录:

将项目中所有的静态资源全部拷贝到该目录下,而后将项目中的静态资源移除重新打包。

稍微修改一下的配置,增加一条匹配规则:

然后照常启动和移除了静态资源的服务,你会发现原本的样式、效果、图片等依旧有效,如下:

其中目录下的文件已被移除,但效果依旧存在(绿色字体+蓝色大边框):

最后解读一下那条location规则:

代表匹配时区分大小写

代表任意字符都可以出现零次或多次,即资源名不限制

代表匹配后缀分隔符.

代表匹配括号里所有静态资源类型

综上所述,简单一句话概述:该配置表示匹配以为后缀的所有资源请求。

「最后提一嘴,也可以将静态资源上传到文件服务器中,然后中配置一个新的指向。」

五、Nginx资源压缩

建立在动静分离的基础之上,如果一个静态资源的越小,那么自然传输速度会更快,同时也会更节省带宽,因此我们在部署项目时,也可以通过对于静态资源实现压缩传输,一方面可以节省带宽资源,第二方面也可以加快响应速度并提升系统整体吞吐。

在也提供了三个支持资源压缩的模块,其中属于内置模块,代表着可以直接使用该模块下的一些压缩指令,后续的资源压缩操作都基于该模块,先来看看压缩配置的一些参数/指令:

了解了中的基本压缩配置后,接下来可以在中简单配置一下:

在上述的压缩配置中,最后一个选项,可以根据系统的实际情况决定,总共存在多种选项:

:关闭对后台服务器的响应结果进行压缩。

:如果响应头中包含信息,则开启压缩。

:如果响应头中包含信息,则开启压缩。

:如果响应头中包含信息,则开启压缩。

:如果响应头中包含信息,则开启压缩。

:如果响应头中不包含信息,则开启压缩。

:如果响应头中不包含信息,则开启压缩。

:如果响应头中包含信息,则开启压缩。

:无条件对后端的响应结果开启压缩机制。

OK~,简单修改好了的压缩配置后,可以在原本的页面中引入一个文件:

分别来对比下压缩前后的区别:

从图中可以很明显看出,未开启压缩机制前访问时,文件的原始大小为,当配置好压缩后再重启,会发现文件大小从,效果立竿见影!

注意点:对于图片、视频类型的数据,会默认开启压缩机制,因此一般无需再次开启压缩。对于文件而言,需要指定压缩类型为,而并非。

六、Nginx缓冲区

先来思考一个问题,接入的项目一般请求流程为:“客户端服务端”,在这个过程中存在两个连接:“客户端、服务端”,那么两个不同的连接速度不一致,就会影响用户的体验(比如浏览器的加载速度跟不上服务端的响应速度)。

其实也就类似电脑的内存跟不上速度,所以对于用户造成的体验感极差,因此在设计时都会加入三级高速缓冲区,用于缓解和内存速率不一致的矛盾。在也同样存在缓冲区的机制,主要目的就在于:「「用来解决两个连接之间速度不匹配造成的问题」」,有了缓冲后,代理可暂存后端的响应,然后按需供给数据给客户端。先来看看一些关于缓冲区的配置项:

:是否启用缓冲机制,默认为关闭状态。

:设置缓冲客户端请求数据的内存大小。

:为每个请求/连接设置缓冲区的数量和大小,默认。

:设置用于存储响应头的缓冲区大小。

:在后端数据没有完全接收完成时,可以将状态的缓冲返回给客户端,该参数用来设置状态的具体有多大,默认为。

:当内存缓冲区存满时,可以将数据临时存放到磁盘,该参数是设置存储缓冲数据的目录。

是临时目录的路径。

语法: path是临时目录的路径

:设置每次写数据到临时文件的大小限制。

:设置临时的缓冲目录中允许存储的最大容量。

非缓冲参数项:

:设置与后端服务器建立连接时的超时时间。

:设置从后端服务器读取响应数据的超时时间。

:设置向后端服务器传输请求数据的超时时间。

具体的配置如下:

上述的缓冲区参数,是基于每个请求分配的空间,而并不是所有请求的共享空间。当然,具体的参数值还需要根据业务去决定,要综合考虑机器的内存以及每个请求的平均数据大小。

最后提一嘴:使用缓冲也可以减少即时传输带来的带宽消耗。

七、Nginx缓存机制

对于性能优化而言,缓存是一种能够大幅度提升性能的方案,因此几乎可以在各处都能看见缓存,如客户端缓存、代理缓存、服务器缓存等等,的缓存则属于代理缓存的一种。对于整个系统而言,加入缓存带来的优势额外明显:

减少了再次向后端或文件服务器请求资源的带宽消耗。

降低了下游服务器的访问压力,提升系统整体吞吐。

缩短了响应时间,提升了加载速度,打开页面的速度更快。

那么在中,又该如何配置代理缓存呢?先来看看缓存相关的配置项:

「proxy_cache_path」:代理缓存的路径。

语法:

是的,你没有看错,就是这么长....,解释一下每个参数项的含义:

:缓存的路径地址。

:缓存存储的层次结构,最多允许三层目录。

:是否使用临时目录。

:指定一个共享内存空间来存储热点Key(1M可存储8000个Key)。

:设置缓存多长时间未被访问后删除(默认是十分钟)。

:允许缓存的最大存储空间,超出后会基于LRU算法移除缓存,Nginx会创建一个Cache manager的进程移除数据,也可以通过purge方式。

:manager进程每次移除缓存文件数量的上限。

:manager进程每次移除缓存文件的时间上限。

:manager进程每次移除缓存后的间隔时间。

:重启Nginx载入缓存时,每次加载的个数,默认100。

:每次载入时,允许的最大时间上限,默认200ms。

:一次载入后,停顿的时间间隔,默认50ms。

:是否开启purge方式移除数据。

:每次移除缓存文件时的数量。

:每次移除时,允许消耗的最大时间。

:每次移除完成后,停顿的间隔时间。

「proxy_cache」:开启或关闭代理缓存,开启时需要指定一个共享内存区域。

语法:

zone为内存区域的名称,即上面中keys_zone设置的名称。

「proxy_cache_key」:定义如何生成缓存的键。

语法:

string为生成Key的规则,如。

「proxy_cache_valid」:缓存生效的状态码与过期时间。

语法:

code为状态码,time为有效时间,可以根据状态码设置不同的缓存时间。

例如:

「proxy_cache_min_uses」:设置资源被请求多少次后被缓存。

语法:

number为次数,默认为1。

「proxy_cache_use_stale」:当后端出现异常时,是否允许Nginx返回缓存作为响应。

语法:

error为错误类型,可配置。

「proxy_cache_lock」:对于相同的请求,是否开启锁机制,只允许一个请求发往后端。

语法:

「proxy_cache_lock_timeout」:配置锁超时机制,超出规定时间后会释放请求。

「proxy_cache_methods」:设置对于那些HTTP方法开启缓存。

语法:

method为请求方法类型,如GET、HEAD等。

「proxy_no_cache」:定义不存储缓存的条件,符合时不会保存。

语法:

string为条件,例如

「proxy_cache_bypass」:定义不读取缓存的条件,符合时不会从缓存中读取。

语法:

和上面的配置方法类似。

「add_header」:往响应头中添加字段信息。

语法:

「$upstream_cache_status」:记录了缓存是否命中的信息,存在多种情况:

:请求未命中缓存。

:请求命中缓存。

:请求命中缓存但缓存已过期。

:请求命中了陈旧缓存。

:Nginx验证陈旧缓存依然有效。

:命中的缓存内容陈旧,但正在更新缓存。

:响应结果是从原始服务器获取的。

PS:这个和之前的不同,之前的都是参数项,这个是一个Nginx内置变量。

OK~,对于中的缓存配置项大概了解后,接着来配置一下代理缓存:

接着来看一下效果,如下:

第一次访问时,因为还没有请求过资源,所以缓存中没有数据,因此没有命中缓存。第二、三次,依旧没有命中缓存,直至第四次时才显示命中,这是为什么呢?因为在前面的缓存配置中,我们配置了加入缓存的最低条件为:「「资源至少要被请求三次以上才会加入缓存。」」这样可以避免很多无效缓存占用空间。

缓存清理

当缓存过多时,如果不及时清理会导致磁盘空间被“吃光”,因此我们需要一套完善的缓存清理机制去删除缓存,在之前的参数中有相关的选项,开启后可以帮我们自动清理缓存,但遗憾的是:**系列参数只有商业版的才能使用,因此需要付费才可使用。**

不过天无绝人之路,我们可以通过强大的第三方模块来替代,先来安装一下该插件:首先去到的安装目录下,创建一个目录:

通过指令从上拉取安装包的压缩文件并解压:

再次去到之前的解压目录下:

重新构建一次,通过的指令添加刚刚的第三方模块:

重新根据刚刚构建的,再次编译一下,「但切记不要」

删除之前的启动文件,不放心的也可以移动到其他位置:

从生成的目录中,重新复制一个的启动文件到原来的位置:

至此,第三方缓存清除模块就安装完成了,接下来稍微修改一下配置,再添加一条规则:

然后再重启,接下来即可通过的方式清除缓存。

八、Nginx实现IP黑白名单

有时候往往有些需求,可能某些接口只能开放给对应的合作商,或者购买/接入的合作伙伴,那么此时就需要实现类似于白名单的功能。而有时候有些恶意攻击者或爬虫程序,被识别后需要禁止其再次访问网站,因此也需要实现黑名单。那么这些功能无需交由后端实现,可直接在中处理。

做黑白名单机制,主要是通过配置项来实现:

要同时屏蔽/开放多个访问时,如果所有全部写在文件中定然是不显示的,这种方式比较冗余,那么可以新建两个文件:

分别将要禁止/开放的添加到对应的文件后,可以再将这两个文件在中导入:

对于文件具体在哪儿导入,这个也并非随意的,如果要整站屏蔽/开放就在中导入,如果只需要一个域名下屏蔽/开放就在中导入,如果只需要针对于某一系列接口屏蔽/开放,那么就在中导入。

当然,上述只是最简单的黑/白名单实现方式,同时也可以通过第三方库去实现(这种方式可以按地区、国家进行屏蔽,并且提供了库)。

九、Nginx跨域配置

跨域问题在之前的单体架构开发中,其实是比较少见的问题,除非是需要接入第三方时,才需要处理此问题。但随着现在前后端分离、分布式架构的流行,跨域问题也成为了每个Java开发必须要懂得解决的一个问题。

跨域问题产生的原因

产生跨域问题的主要原因就在于「同源策略」,为了保证用户信息安全,防止恶意网站窃取数据,同源策略是必须的,否则可以共享。由于无状态协议通常会借助来实现有状态的信息记录,例如用户的身份/密码等,因此一旦被共享,那么会导致用户的身份信息被盗取。

同源策略主要是指三点相同,「「协议+域名+端口」」相同的两个请求,则可以被看做是同源的,但如果其中任意一点存在不同,则代表是两个不同源的请求,同源策略会限制了不同源之间的资源交互。

Nginx解决跨域问题

弄明白了跨域问题的产生原因,接下来看看中又该如何解决跨域呢?其实比较简单,在中稍微添加一点配置即可:

在文件加上如上配置后,跨域请求即可生效了。

但如果后端是采用分布式架构开发的,有时候RPC调用也需要解决跨域问题,不然也同样会出现无法跨域请求的异常,因此可以在你的后端项目中,通过继承类、实现接口、添加注解的方式实现接口之间的跨域配置。

十、Nginx防盗链设计

首先了解一下何谓盗链:「「盗链即是指外部网站引入当前网站的资源对外展示」」,来举个简单的例子理解:

好比壁纸网站站、站,站是一点点去购买版权、签约作者的方式,从而积累了海量的壁纸素材,但站由于资金等各方面的原因,就直接通过这种方式照搬了站的所有壁纸资源,继而提供给用户下载。

那么如果我们自己是这个站的,心中必然不爽,那么此时又该如何屏蔽这类问题呢?那么接下来要叙说的「「防盗链」」登场了!

的防盗链机制实现,跟一个头部字段:有关,该字段主要描述了当前请求是从哪儿发出的,那么在中就可获取该值,然后判断是否为本站的资源引用请求,如果不是则不允许访问。中存在一个配置项为,正好可以满足前面的需求,语法如下:

:表示接受没有字段的请求访问。

:表示允许或以外的请求访问。

:资源的白名单,这里可以指定允许访问的域名。

:可自定义字符串,支配通配符、正则表达式写法。

简单了解语法后,接下来的实现如下:

根据上述中的内容配置后,就已经通过实现了最基本的防盗链机制,最后只需要额外重启一下就好啦!当然,对于防盗链机制实现这块,也有专门的第三方模块实现了更为完善的设计,感兴趣的小伙伴可以自行去看看。

PS:防盗链机制也无法解决爬虫伪造信息的这种方式抓取数据。

十一、Nginx大文件传输配置

在某些业务场景中需要传输一些大文件,但大文件传输时往往都会会出现一些,比如文件超出限制、文件传输过程中请求超时等,那么此时就可以在稍微做一些配置,先来了解一些关于大文件传输时可能会用的配置项:

在传输大文件时,、、、这四个参数值都可以根据自己项目的实际情况来配置。

上述配置仅是作为代理层需要配置的,因为最终客户端传输文件还是直接与后端进行交互,这里只是把作为网关层的配置调高一点,调到能够“容纳大文件”传输的程度。当然,中也可以作为文件服务器使用,但需要用到一个专门的第三方模块,如果项目中文件上传的作用处不多,那么建议可以通过搭建,毕竟可以节省一台文件服务器资源。但如若文件上传/下载较为频繁,那么还是建议额外搭建文件服务器,并将上传/下载功能交由后端处理。

十二、Nginx配置SLL证书

随着越来越多的网站接入,因此中仅配置还不够,往往还需要监听端口的请求,为了确保通信安全,所以服务端需配置对应的数字证书,当项目使用作为网关时,那么证书在中也需要配置,接下来简单聊一下关于证书配置过程:

先去CA机构或从云控制台中申请对应的证书,审核通过后下载版本的证书。

下载数字证书后,完整的文件总共有三个::

:数字证书文件,是的拓展文件,因此有些人下载后可能没有。

:服务器的私钥文件,及非对称加密的私钥,用于解密公钥传输的数据。

:编码格式的源证书文本文件,可自行根需求修改拓展名。

在目录下新建目录,并将下载好的证书/私钥等文件上传至该目录。

最后修改一下文件即可,如下:

OK~,根据如上配置了后,你的网站即可通过的方式访问,并且当客户端使用的方式访问时,会自动将其改写为请求。

十三、Nginx的高可用

线上如果采用单个节点的方式部署,难免会出现天灾人祸,比如系统异常、程序宕机、服务器断电、机房爆炸、地球毁灭....哈哈哈,夸张了。但实际生产环境中确实存在隐患问题,由于作为整个系统的网关层接入外部流量,所以一旦宕机,最终就会导致整个系统不可用,这无疑对于用户的体验感是极差的,因此也得保障高可用的特性。

接下来则会通过的机制,实现的高可用。并不是只会员的意思,而是指,即虚拟。

在之前单体架构开发时,是一个用的较为频繁的高可用技术,比如等各处都会通过提供的机制,实现单节点应用的高可用。

Keepalived+重启脚本+双机热备搭建

首先创建一个对应的目录并下载到中并解压:

进入解压后的目录并构建安装环境,然后编译并安装:

进入安装目录的并编辑配置文件:

编辑主机的核心配置文件,如下:

克隆一台之前的虚拟机作为从(备)机,编辑从机的文件,如下:

新建目录并编写的重启脚本,:

编写的脚本文件需要更改编码格式,并赋予执行权限,否则可能执行失败:

由于安装时,是自定义的安装位置,因此需要拷贝一些文件到系统目录中:

将加入系统服务并设置开启自启动,然后测试启动是否正常:

其他命令:

最后测试一下是否生效,通过查看本机是否成功挂载虚拟:

从上图中可以明显看见虚拟已经成功挂载,但另外一台机器并不会挂载这个虚拟,只有当主机下线后,作为从机的才会上线,接替。最后测试一下外网是否可以正常与通信,即在中直接:

外部通过通信时,也可以正常通,代表虚拟配置成功。

Nginx高可用性测试

经过上述步骤后,的机制已经搭建成功,在上个阶段中主要做了几件事:

一、为部署的机器挂载了。

二、通过搭建了主从双机热备。

三、通过实现了宕机重启。

由于前面没有域名的原因,因此最初配置的是当前机器的,所以需稍微更改一下的配置:

最后来实验一下效果:

在上述过程中,首先分别启动了服务,然后通过手动停止的方式模拟了宕机情况,过了片刻后再次查询后台进程,我们会发现依旧存活。

从这个过程中不难发现,已经为我们实现了宕机后自动重启的功能,那么接着再模拟一下服务器出现故障时的情况:

在上述过程中,我们通过手动关闭服务模拟了机器断电、硬件损坏等情况(因为机器断电等情况=主机中的进程消失),然后再次查询了一下本机的信息,很明显会看到消失了!

现在再切换到另外一台机器:来看看情况:

此刻我们会发现,在主机宕机后,VIP自动从主机飘移到了从机上,而此时客户端的请求就最终会来到这台机器的上。

「「最终,利用对做了主从热备之后,无论是遇到线上宕机还是机房断电等各类故障时,都能够确保应用系统能够为用户提供小时服务。」」

十四、Nginx性能优化

到这里文章的篇幅较长了,最后再来聊一下关于的性能优化,主要就简单说说收益最高的几个优化项,在这块就不再展开叙述了,毕竟影响性能都有多方面原因导致的,比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等。

优化一:打开长连接配置

通常Nginx作为代理服务,负责分发客户端的请求,那么建议开启长连接,用户减少握手的次数,降低服务器损耗,具体如下:

优化二、开启零拷贝技术

零拷贝这个概念,在大多数性能较为不错的中间件中都有出现,例如等,而中也可以配置数据零拷贝技术,如下:

零拷贝读取机制与传统资源读取机制的区别:

「传统方式:」硬件-->内核-->用户空间-->程序空间-->程序内核空间-->网络套接字

「零拷贝方式:」硬件-->内核-->程序内核空间-->网络套接字

从上述这个过程对比,很轻易就能看出两者之间的性能区别。

优化三、开启无延迟或多包共发机制

在中有两个较为关键的性能参数,即,开启方式如下:

协议中默认是采用了Nagle算法的,即在网络数据传输过程中,每个数据报文并不会立马发送出去,而是会等待一段时间,将后面的几个数据包一起组合成一个数据报文发送,但这个算法虽然提高了网络吞吐量,但是实时性却降低了。

因此你的项目属于交互性很强的应用,那么可以手动开启配置,让应用程序向内核递交的每个数据包都会立即发送出去。但这样会产生大量的报文头,增加很大的网络开销。

相反,有些项目的业务对数据的实时性要求并不高,追求的则是更高的吞吐,那么则可以开启配置项,这个配置就类似于“塞子”的意思,首先将连接塞住,使得数据先不发出去,等到拔去塞子后再发出去。设置该选项后,内核会尽量把小数据包拼接成一个大的数据包(一个)再发送出去.

当然若一定时间后(一般为),内核仍然没有积累到一个的量时,也必须发送现有的数据,否则会一直阻塞。

两个参数是“互斥”的,如果追求响应速度的应用推荐开启参数,如、金融等类型的项目。如果追求吞吐量的应用则建议开启参数,如调度系统、报表系统等。

注意:一般要建立在开启了长连接模式的情况下使用。参数是必须要开启参数才可使用的。

优化四、调整Worker工作进程

启动后默认只会开启一个工作进程处理客户端请求,而我们可以根据机器的CPU核数开启对应数量的工作进程,以此来提升整体的并发量支持,如下:

工作进程的数量最高开到个就OK了,个之后就不会有再大的性能提升。

同时也可以稍微调整一下每个工作进程能够打开的文件句柄数:

操作系统内核()都是利用文件描述符来访问文件,无论是打开、新建、读取、写入文件时,都需要使用文件描述符来指定待操作的文件,因此该值越大,代表一个进程能够操作的文件越多(但不能超出内核限制,最多建议左右为上限)。

优化五、开启CPU亲和机制

对于并发编程较为熟悉的伙伴都知道,因为进程/线程数往往都会远超出系统CPU的核心数,因为操作系统执行的原理本质上是采用时间片切换机制,也就是一个CPU核心会在多个进程之间不断频繁切换,造成很大的性能损耗。

而CPU亲和机制则是指将每个的工作进程,绑定在固定的CPU核心上,从而减小CPU切换带来的时间开销和资源损耗,开启方式如下:

优化六、开启epoll模型及调整并发连接数

在最开始就提到过:都是基于多路复用模型去实现的程序,但最初版的多路复用模型最大只能监听个连接,而则属于接口的增强版,因此采用该模型能够大程度上提升单个的性能,如下:

这里对于模型就不展开细说了,后面的IO模型文章中会详细剖析。

十五、放在最后的结尾

至此,的大部分内容都已阐述完毕,关于最后一小节的性能优化内容,其实在前面就谈到的动静分离、分配缓冲区、资源缓存、防盗链、资源压缩等内容,也都可归纳为性能优化的方案。

热爱技术才能学好技术

每天进步一点点

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230329A019BR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券