一直陪伴你成长的 QQ 相册后台长什么样?

作者:兰瑞

导语:QQ空间陪伴大家走过了将近12年的时光。时至今日,QQ相册已经存储了超过2万亿张图片,对比业界,可以说是当之无愧的中国第一大相册,也是世界上规模最大的图片类产品之一。本文从存储架构、容灾、加速等多方面对相册的架构进行了阐述。

QQ空间(QZone),陪伴大家走过了将近12年的时光。其中的QQ相册,也和大家一路走来,记录下了很多中国人的成长瞬间。

时至今日,QQ相册已经存储了超过2万亿张图片,物理存储量300PB。平均日增3亿张图片,日用户浏览数达500亿次。对比业界,可以说是当之无愧的中国第一大相册,也是世界上规模最大的图片类产品之一。

随着业务的发展,不仅用户看得到的页面样式在变,由腾讯架构平台部开发和运营的相册系统也经历了不断的优化。下面我们介绍一下QQ相册的后台架构长什么样。

如果从头搭建一个小型的相册系统,我们通常想到的架构是这样的。

索引系统存放用户的相册列表和每个相册内的图片列表。文件系统存放实际的图片文件。

实际上最早的QQ相册系统,就是直接用MySQL存储用户索引,Linux文件系统存放图片文件。这是一个最简易的系统,能够满足少量的用户和基本的功能。在面对相册用户和请求量急速增长的过程中,部门针对性地研发了底层的TFS存储系统家族KV引擎进行支撑。

索引

针对相册用户量大、读写频繁、操作数据小、需要支持平滑扩容等特点,TFS推出了基于大容量SSD的分布式K-V存储平台TSSD。通过多副本保证数据可靠性,通过自研持久化存储引擎解决随机写性能瓶颈,结合SSD与生俱来的随机读优势,使得TSSD具备出色的混合读写性能,单台峰值10万+次的读写IOPS。在支持高并发读写的同时, 独有的IO延时毛刺控制技术,使得运营中99.9%读写访问延时低于10ms。

此外,针对用户行为进行分析,发现有大量的用户操作只是拉取相册和图片列表,并没有去查看图片的详细信息。对此,我们对用户索引进行了轻重分离,将列表所需关键信息和其他详细信息分开存储,大大降低了每次操作平均读写的索引数据块大小。

压缩

QQ相册支持JPG、PNG、GIF等主流图片格式,并且在保证图片质量的前提下不断尝试和使用压缩比更高的新格式。比如已经全面支持WebP,比JPG节约存储和带宽30%。目前正在推进使用公司自研图片格式sharpP,对比WebP体积还减少15%以上。

为了应对超大并发量的压缩请求,我们搭建了几千台机器规模的压缩集群。并且这部分压缩集群大部分使用Docker技术,和现有业务机器混用,显著节约了成本。 对于时延敏感的场景,我们还推广使用了FPGA硬件压缩卡,耗时仅为CPU机器的10%。这项能力目前也通过腾讯云对外开放。

园区分布

10亿+的相册用户被逻辑上划分到不同的园区,每个园区都有一套完整的服务。每个园区可以平滑扩容,园区也可以按需增加。

就近上传

为了保证索引信息的一致性,每个用户的完整索引信息最终只会保存在某一个特定园区。用户的园区归属信息是预先划分好的。比如一个用户的索引归属信息在上海,他在深圳出差期间,如果每次上传需要访问上海的服务器,延时将很高。

为此我们后台进行了就近上传的改造,用户上传图片时,会根据地域、运营商接入最近的上传园区,并就近落地图片数据。索引归属信息则由我们的server在后台进行同步。很大程度提高了上传成功率,降低了响应时延。

异地容灾

当程序感知到某个园区发生网络故障等情况时,数据和索引可以写入备份点。多个园区之间形成了一个环状备份关系。

下载加速

在全国建立了30+个CDN加速点,就近为用户提供下载服务。还建有香港和美国加速点,为海外用户提供加速。

cache预推送

根据对用户行为的分析,最近上传的图片访问量往往最大。为了给用户提供更好的下载体验,在用户上传相册后,我们会预先发送指令给CDN加速点通知它们拉取图片进行缓存,当后续用户的好友进行访问时,能够快速加载,无需回源。

未来我们还会在提升服务质量和稳定性上继续努力,让网友们放心、便捷地使用QQ相册来记录生活点滴。

文章来自:腾讯架构师

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算D1net

关于第三方云管理工具你应该了解的

尽管云供应商一般会提供强大的云环境管理工具组,但是第三方工具确实能够起到很大作用。高度分散的云基础架构时常需要细分到一定水平的工具,而源生的云监控工具无法满足这...

2706
来自专栏原创

个推技术实现原理介绍

概述 PUSH是互联网上内容提供者和内容定制方之间的一种通信机制,利用在服务器端的程序把数据源源不断地推向客户端,大大提高客户机和服务器之间的交互性能。 传统互...

3027
来自专栏BestSDK

SDKBOX手游服务接入助手,扫开所有难题成就时代神话

编辑导语 技术不在于多,在于精。SDKBOX手游服务接入方案,让你分分钟搞定几周的工作,正所谓的“一分投入,十分收益”。技术竞争时代,你慢一步,就需要几年的时间...

2339
来自专栏Android 开发者

正式发布Android Things 1.0

1323
来自专栏腾讯大讲堂的专栏

一直陪伴你成长的QQ相册后台长什么样?

QQ空间陪伴大家走过了将近12年的时光。时至今日,QQ相册已经存储了超过2万亿张图片,对比业界,可以说是当之无愧的中国第一大相册,也是世界上规模最大的图片类产品...

39510
来自专栏小俊博客

CloudFlare公共DNS服务遭遇“宕机”

1834
来自专栏IT技术精选文摘

浅谈iOS和Android后台实时消息推送的原理和区别

1563
来自专栏情醉中国风

基于云安全环境的最佳实践

无论您是打算使用托管服务来处理你们组织的云安全,还是决定创建管理自己的安全项目,至少,将所需的所有信息汇总起来就可能是一项复杂的任务了。为了解决这个问题,我们想...

1969
来自专栏BestSDK

一个“爆款”Android SDK肯定具备这三个条件

对于开发者来说,一款好的SDK会让你事半功倍,减少开发时间的同时,又免去了复杂的维护工作;作为厂商,为了赢得更多开发者支持,打造一款——“爆款SDK”自然是必不...

2575
来自专栏云计算D1net

云备份和标准数据中心的备份有所不同

在云计算的环境中,灾难恢复包含了一组新的选项,它们看起来与您在本地系统中拥有的选项大不一样。您最终采取的方法应该与应用程序和数据集对业务价值的大小相匹配。

660

扫码关注云+社区