LinkedIn 即时通信系统的优化

前言

LinkedIn 的即时通信系统目前单台机器可以处理数十万的持久连接,这是不断调优的结果。

最近,他们在官网博客中发布了优化过程,介绍了即时通信系统的技术选型、调优的重点。

基础技术构成

即时通信技术的基本要求就是server能够向client推送数据,需要通过持久连接实现,而不是传统的“请求-响应”模式。

对于这个需求,LinkedIn 选择了 Server-sent events (SSE)来实现。

SSE 特点是简单、兼容性好,client只需要和server建立一个普通的HTTP连接,当server中有事件发送时,就会向client推送数据流。

配合 SSEEventSource 接口被所有现代浏览器支持,iOS 与 Android 中也有现成的库,所以 SSE 的兼容性不成问题,这也是 LinkedIn 没有选择 Websockets 原因。

开发语言使用 JAVA,编程模型选用 Actor模型Akka是一个优秀的Actor库。

开发框架使用了 Play,他可以很好的集成 EventSourceAkka

优化过程

  • socket最大连接数限制

LinkedIn 刚开始做性能测试时,发现并发连接始终无法超过128个,这肯定是不正常的,应用服务器处理上千并发连接是很轻松的,后来发现是一个系统内核参数的限制:

net.core.somaxconn

这个参数控制的是允许积压的TCP连接数量, 当一个连接请求过来时,如果数量达到上限了,就会被拒绝掉,128是很多系统的默认值。

可以在 /etc/sysctl.conf中进行调整。

  • 临时端口的限制

负载均衡器每次连接到一个server节点时,都会使用一个 临时端口,当连接终止时,这个端口会再次可用。

而持久连接不会像普通HTTP连接那样终止,所以,负载均衡器的临时端口就可能被耗尽。

这一点需要在选择负载均衡器时特别注意。

  • 文件描述符的限制

在加大测试压力后,出现了一个异常:

java.net.SocketException: Too many files open

这说明文件描述符不够用了,在 Linux 中,一切皆文件,例如访问标准的文件、连接网络socket 等等,都需要文件描述符。

对于运行中进程的文件描述符限制,可以这样查看:

$ cat /proc/<pid>/limits

...
Max open files            30000

假设想调整到 200000,修改 /etc/security/limits.conf

<process username>  soft nofile 200000

<process username>  hard nofile 200000

系统级的文件描述符限制的调整是在 /etc/sysctl.conf 中:

fs.file-max

小结

这里整理的是几个通用的优化点,原文中有更详细的描述,还有两点对JVM的调优,有兴趣的朋友可以看下原文,地址:

https://engineering.linkedin.com/blog/2016/10/instant-messaging-at-linkedin--scaling-to-hundreds-of-thousands-

原文发布于微信公众号 - 性能与架构(yogoup)

原文发表时间:2016-10-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

我与学校SafeConnect软件斗智斗勇的经历

*本文原创作者:zasdfgbnm,本文属FreeBuf原创奖励计划,未经许可禁止转载 故事是这样的,本文作者在美国某大学读书,学校IT部门要求我们如果Win...

29750
来自专栏郭霖

Android Studio新功能解析,你真的了解Instant Run吗?

本篇文章首发于我的微信公众号,由于网上讲解Android Studio中Instant Run功能的文章实在是太少了,为了让更多人可以了解这个技术,我将这篇文...

22580
来自专栏FreeBuf

挖洞经验 | 看我如何综合利用4个漏洞实现GitHub Enterprise 远程代码执行

大家好,距离上次漏洞披露已有半年之余,在这篇文章中,我将向大家展示如何通过4个漏洞完美实现GitHub Enterprise的RCE执行,该RCE实现方法与服务...

46960
来自专栏Java成神之路

Java程序员常用工具集

我发现很多人没办法高效地解决问题的关键原因是不熟悉工具,不熟悉工具也还罢了,甚至还不知道怎么去找工具,这个问题就大条了。我想列下我能想到的一个Java程序员会用...

16930
来自专栏游戏杂谈

liunx下查看服务器硬件信息

今天安装了9台Linux服务器,型号完全不一样(有DELL、HP和IBM服务器),又懒得去对清单,如何在Linux下cpu的个数和核数呢?另外,nginx的cp...

1.1K20
来自专栏一名合格java开发的自我修养

kafka0.8--0.11各个版本特性预览介绍

kafka-0.8.2 新特性 producer不再区分同步(sync)和异步方式(async),所有的请求以异步方式发送,这样提升了客户端效率。produc...

8820
来自专栏吉浦迅科技

【用户经验分享】NVIDIA Jetson TX2开发板运行 jetson-inference 出现问题的终极解决办法

注 之前本公众号发布了一个教程【入门篇】Jetson TX2深度学习Inference初体验,里面提到一个步骤,就是可能会出现错误,提示nvidia.app.b...

1.4K50
来自专栏mySoul

Linux基础知识

软件运行时输入单元输入内容,进入内存,CPU由控制单元和算术逻辑单元组成,控制单元控制算术逻辑单元从内存中读取数据,内存和外部存储设备进行交互,运算完毕以后输出...

28540
来自专栏恰童鞋骚年

NoSQL初探之人人都爱Redis:(1)Redis简介与简单安装

  随着互联网Web2.0网站的兴起,传统的关系数据库在应付Web2.0网站,特别是超大规模和高并发的SNS类型的Web2.0纯动态网站已经显得力不从心,暴露了...

13120
来自专栏企鹅号快讯

MITM6:用IPv6攻陷IPv4网络的工具

随着IPv6概念的提出,互联网上针对IPv6协议的使用也日渐增多,但即便如此IPv6在公司内部却并不受欢迎,很少会有公司使用IPv6。然而,大多数公司可能都忽略...

41170

扫码关注云+社区

领取腾讯云代金券