微信客户端性能监控和优化简述

今天主题,产品数量级上去了之后很多人都会去关心性能问题。这里是Info对微信性能优化上的一些探寻,值得参考。

陈岳伟(Lylechen),微信客户端开发团队负责人,统筹微信在 iOS、Android、Mac 和 Windows 等平台的开发管理工作。2010 年加入微信团队,从无到有构建出微信的第一个 iOS 版本,并持续不断进行架构优化和性能稳定性打磨。近年来主要关注微信终端监控体系以及微信重度用户的性能提升和体验优化。

一款产品能否与用户产生化学反应,客户端在这一过程中的性能作用最关键。启动时间太长、内存消耗太大、ANR 等等,都会直接影响用户对一款应用的判断和使用体验。

如微信 Slogan 说的那样:微信,是一个生活方式。所以,微信 App 本身就包含非常多且复杂度高的业务模块(如搜索、视频等),也接入了很多第三方的插件,这势必会拖慢应用的启动时间和响应速度,尤其是目前出现了“微信重度用户”这一现象,迫使微信追求更多的分析和优化措施。

在由听云联合极客邦科技 /InfoQ 共同主办的 APMCon 2017 会议上,我们邀请微信“小黑屋 11 人”之一的微信客户端开发团队负责人陈岳伟(Lylechen)来 APMCon 现场分享“微信重度⽤户体验的优化之道”。InfoQ 对陈岳伟进行了会前采访,简单了解了微信在客户端性能监控和优化做了哪些工作。

InfoQ:请介绍一下,微信 iOS 客户端第一个版本开发花了多长时间,在性能上有哪些关注点?

陈岳伟:第一个 iOS 和 Android 微信版本均花了 2 个月左右的开发时间。初期阶段主要集中在功能开发上,对性能没有特别花太多时间关注,主要对于启动速度、消息收发等主场景做了压力测试。对于一个初创的产品,微信研发团队更看重版本的快速迭代,“先迭代再优化”是第一原则。

InfoQ:目前微信客户端有哪些维度的性能监控,侵入性如何,对性能有何影响?

陈岳伟:目前微信客户端的性能监控纬度,主要包含 Crash、卡顿、耗时、内存、SQLite、安装包大小、网络性能等。

微信研发团队所做的监控系统可以分为两类:一类是通用监控,一类是专项监控。

针对通用监控,团队搭建了一套基于简单数值上报的终端实时监控系统,可以覆盖几乎所有的监控纬度,最终呈现出来的是 PV、UV、耗时分布、错误统计等。比如准实时生成客户端启动次数、Crash 次数、网络调用次数等曲线,最少延迟可以做到 10 分钟以内。

通用监控主要用于快速发现问题,而其定位问题的能力相对较弱,于是构建了多个专项监控系统。举个例子,微信团队构建的卡顿监控系统,不仅可以监控客户端卡顿次数,还可以展示卡顿堆栈分类和排序,部分场景还可以做到精确标示函数调用的耗时分布。当然专项监控的上报延时更长,数据计算也比较复杂,目前能做到“小时~天”的级别,主要起分析定位的作用。

大部分监控以手动埋点、框架性自动埋点以及触发式上报为主,对性能影响很小。SQLite 和耗时监控,涉及较细力度的插桩,会有一定的性能损耗,前者主要用于开发和自动化测试阶段,后者对现网用户做了一定的采样。

InfoQ:微信客户端在性能上有哪些优化点?

陈岳伟:针对微信客户端的性能优化,主要分为网络、UI、内存、存储等四大模块。

网络方面,在 IPList 选择策略、复合连接、连接耗时和稳定性、收发包耗时和稳定性、协议包压缩精简等诸多方面均作了长期的优化措施;针对安卓的后台长连接这一项,研发团队就在心跳策略、Push 及时性等方面做了很多工作。(参照 Mars 开源项目了解更多)

UI 方面,除了经典 TableView 和 ListView 优化外,团队在图片 / 视频编解码、Bitmap 磁盘映射、视频渲染 Open GL 等领域也花了不少功夫。

内存方面,微信团队构建了实用的内存泄漏工具以及前台 OOM 检测工具,在开发过程中即可快速发现内存访问不当的代码实现;针对联系人、头像和图片等模块做了统一的资源池,制定了符合微信特点的缓存和淘汰策略。

存储方面,团队研发了高易用接口的 WCDB 组件,统一了微信内的 DB 线程模型和事务机制;根据微信客户端的消息、联系人、朋友圈和收藏等模块做了针对性的 DB 分离和数据表拆分;通过修改 SQLite 源码,大幅度降低了 SQLITE_BUSY 的发生次数;通过配置 DB 文件和 WAL 文件的 mmap 模式,对 DB 的 IO 性能也有不少的提升。关于这方面的内容,欢迎大家参考 WCDB 开源项目。

InfoQ:微信客户端目前开发了哪些跨端组件,是否均使用 C/C++ 开发?

陈岳伟:目前主要有两大跨平台组件,包括 Mars 组件(COMM、XLOG、SDT、STN,详见 Mars 介绍)和 WCDB 组件。其中 Mars 全部使用 C/C++ 开发,可适用于 iOS、Android、Windows 和 Mac 等平台;而 WCDB 主要根据 iOS(MacOS)和 Android 两个平台提供了不同的语言适配,但底层的 SQLite 源码优化和 RepairKit,还是继续采用 C/C++ 开发。

InfoQ:微信 iOS 端在 WebView 上做了哪些优化,有哪些性能监控点?

陈岳伟:iOS 端的 WebView 主要做了资源预加载与缓存、视频代理与下载策略优化、图片代理与编码优化等,针对 WebView 安全和微信特有的 JS SDK 也有一系列的优化策略。

目前微信绝大部分 WebView,均已替换为 WKWebView,在内存占用和稳定性上有很大的提升。性能监控点,主要包含各阶段耗时分布、相关错误码分类和内存 OOM 监控。

InfoQ:针对重度用户的体验优化是从什么时候开始的?当时的出发点是什么?到目前主要做了哪些工作,有什么规划?

陈岳伟:从 2015 年底开始,当时出发点是 DB 损坏率极速上升,以及用户存储空间快速增长;目前主要对 DB 损坏、内存 OOM 和存储架构等做部分优化工作,前两者会在 APMCon 给大家做详细分享;后续希望对重度用户大盘进行更精确的监控和分析,提升问题发现和定位能力。

图片来源:视觉中国

原文发布于微信公众号 - Android历练记(gh_db8538619cdd)

原文发表时间:2017-07-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

Facebook又有隐私事件:软件漏洞,1400万用户私密帖被公开

Facebook今日向约1400万用户发出通知,称发现了一个软件漏洞,导致用户发表的认为只有朋友可见的私密帖子实际上所有人都看得到。

753
来自专栏Java架构师学习

七年的资深架构师告诉你成为架构师的知识体系

架构师是一个充满挑战的职业,知识面的宽窄往往决定着一个架构师的架构能力 知识面的宽广对于一名出色的架构师来说是必不可少的技能,也许很多人对架构的理解还停留在设...

4764
来自专栏张善友的专栏

MongoDB 如何使定制电子商务变得简单

开源电子商务软件市场已经历了众多发展阶段,您可能已经通过 osCommerce、Magento、Zen Cart、PrestaShop、Spree 等流行平台而...

2227
来自专栏互联网数据官iCDO

【经典文章】运营优化的秘密武器:重新认识热图的力量!

主编注:这篇文章获得业内很高的关注。是宋星老师的另一篇讲述如何优化网站页面尤其是着陆页的经典文章。 引言   之前发布的文章:《优化高跳出率着陆...

3364
来自专栏Laoqi's Linux运维专列

饿了么的架构设计及演进之路(转)

2026
来自专栏java一日一条

软件开发中最顶级的 17 个平台和工具

当你在决定使用哪些软件或平台来完成日常工作时,会存在很多选择。所以,我决定写一个我们在开发部门常用的软件开发工具列表,希望能对其他所有人都有所帮助。

2433
来自专栏SDNLAB

【8点20】深入了解Facebook 的Altoona数据中心网络

Facebook最近秀了一下Altoona数据中心网络的高度模块化和可扩展性。这个社交网络巨头高调公布了数据中心网络解决方案,因为Facebook想围绕开放计算...

3695
来自专栏华章科技

【译文】如何打造高性能大数据分析平台

大数据是最近IT界最常用的术语之一。然而对大数据的定义也不尽相同,所有已知的论点例如结构化的和非结构化、大规模的数据等等都不够完整。大数据系统通常被认为具有数据...

954
来自专栏13blog.site

Spring+SpringMVC+MyBatis+easyUI整合优化篇(三)代码测试

前言 看到标题你可能会问为什么这一篇会谈到代码测试,不是说代码优化么?前两篇主要是讲了程序的输出及Log4j的使用,Log能够帮助我们进行bug的定位,优化开发...

28810
来自专栏HBStream流媒体与音视频技术

HTTP Live Streaming直播(iOS直播)技术分析与实现

   不经意间发现,大半年没写博客了,自觉汗颜。实则2012后半年,家中的事一样接着一样发生,实在是没有时间。快过年了,总算忙里偷闲,把最近的一些技术成果,总结...

4518

扫码关注云+社区

领取腾讯云代金券