GT3.1简化您的App性能测试(2)——原理讲解,溯本求源

导读

GT3.1的版本更新,带来了全面的维度分析。那么这些功能是如何实现的呢?本章GT君将详细的从CUP维度、内存维度、流量维度、流畅度维度为大家讲解这些功能的作用和实现原理。

1 CPU

/proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间。它以文件系统的方式为内核与进程提供通信的接口。 从proc文件中可以获取系统、进程、线程的CPU时间片使用情况,所以两次采集时间片的数据就可以获取进程CPU占用率, CPU占用率 = (进程T2-进程T1)/(系统T2-系统T1) 的时间片比值。

1.1 获取系统CPU时间片

获取系统CPU时间片使用情况:读取proc/stat,文件的内容如下:

文件第一行各个字段的含义:

总的CPU时间:totalCpuTime = user + nice + system + idle + iowait + irq + softirq

1.2 获取进程和线程的CPU时间片

获取进程CPU时间片使用情况:读取proc/pid/stat,获取线程CPU时间片使用情况:读取proc/pid/task/tid/stat,这两个文件的内容相同,如下:

标记中四位有对应字段的含义:

  • utime=41958:该任务在用户态运行的时间,单位为jiffies
  • stime=31:该任务在核心态运行的时间,单位为jiffies
  • cutime=0:累计的该任务的所有的waited-for进程曾经在用户态运行的时间,单位为jiffies
  • cstime=0:累计的该任务的所有的waited-for进程曾经在核心态运行的时间,单位为jiffies

进程的总CPU时间:

processCpuTime = utime + stime + cutime + cstime

线程的总CPU时间:

threadCpuTime = utime + stime + cutime + cstime

1.3 CPU数据的统计与分析

基础性能维度CPU取值是采用的是相对值:

processCpuTime /totalCpuTime。

线程时间片维度CPU取值采用的是每秒的绝对值,即threadCpuTime。

我们统计的CPU使用,也已经将GT引入线程的损耗在总体的CPU使用中排除,因此结果可靠。

2 内存

2.1 系统内存

(1)系统内存总容量:只需要读取“/proc/meminfo”文件的第一个字段“MemTotal”就可以了,代表着系统所有可用的RAM大小,文件的内容如下:

(2)系统空闲的内存:只需要通过ActivityManager即可获取。

(3)系统已用内存:总内存与空闲内存做差。

2.2 进程内存

(1)进程内存上限:

(2)进程总内存:

3 流量

TrafficStats类是由Android提供的一个从你的手机开机开始,累计到现在使用的流量总量,或者统计某个或多个进程或应用所使用的流量,当然这个流量包括的Wifi和移动数据网Gprs。

获取进程流量的方法:

4 流畅度检测

4.1 流畅值(SM)定义

Android系统每隔16.7ms发出垂直同步信号(VSync信号)(1000ms/60=16.66ms),触发对UI进行渲染, 如果每次渲染都成功,这样就能够达到流畅的画面所需要的60帧/s,为了能够实现60帧/s,这意味着计算渲染的大多数操作都必须在16.7ms内完成。

所以当绘帧间隔超过16.7ms,垂直同步机制会让显示器硬件等待GPU完成栅格化渲染操作, 我们就可以说此时掉帧了,也就会造成用户直接感官的卡顿。

在这里,我们把1秒内vSync信号的次数,定义为流畅值,即SM。

对于卡顿的不同情况我们分为以下两类:

(1)低流畅值区间:连续小卡顿造成的丢帧,即平均流畅值低于40帧/s的区间;

(2)单次大卡顿:单次大卡顿造成的丢帧,既两次绘帧间隔大于70ms,相当于丢了4帧以上的区间。

4.2 SM计算原理

首先Android的帧绘制流程是:CPU主线程图像处理->GPU进行光栅化->显示帧。APP产生掉帧的情况大多是由“CPU主线程图像处理”这一步超负载引起的,所以我们思考如何去监控主线程绘制情况。要检测CPU绘制帧的时间,就必须找到那个调用View.dispatchDraw的类,Choreographer类就是那个接受系统垂直同步信号(VSync信号),在每次接受VSync信号时顺序执行View的Input、Animation、Draw等3个操作,然后等待下一个信号,再次顺序执行3个操作。如果第二个信号到来时,Draw操作没有按时完成,界面将不会更新,显示的还是第一帧的内容。这就表示丢帧了,丢帧是造成画面卡顿的原因。

所以我们可以向Choreographer类中加入自己的Callback,通过此Callback的doFrame函数我们可以统计一秒内帧绘制的次数,即流畅值SM,它能直观的代表当前时间段的流畅度。之所以不用FPS来代表当前流畅度,是因为Android系统默认在前台页面静止时,FPS可能为0,FPS低无法直接代表当前处于卡顿。

4.3 SM计算代码实现

利用Choreographer.FrameCallback计算流畅值相关代码:

上述代码中的pushData会记录doFrame的执行信息,这样就可以统计出1S内的执行次数,算出SM。

4.4 如何正确采集耗时代码的调用栈信息呢?

要获取主线程的调用栈信息,我们需要创建一个新的线程,在新的线程中使用uiThread.getStackTrace()来获取主线程的栈信息。这里主要说明,采集栈信息的时机。

实现逻辑,使用handler的postDelayed方法延时发送stackCollectRunnable采集栈信息,延时时间为interval(30ms,大于正常绘制1帧的时间,略小于正常绘制2帧的时间)。每一次帧绘制皆会回调doFrame函数,如果每次回调的时间间隔不超过interval,那么消息队列中的栈采集消息将被移除,如果超时,那么消息未被移除,将开始栈信息的采集。基于此,就可以正确定位造成丢帧的耗时代码了。

建立一个新的线程:

栈采集实现:

从代码可以注意到,每次采集完成,会发起下一条采集。如果下一次doFrame回调小于interval时间,stackCollectRunnable被移除,不再采集;如果下一次doFrame回调时间大宇interval时间,则stackCollectRunnable会执行采集操作;同时doFrame会在移除上一个stackCollectRunnable后新添一个stackCollectRunnable,保证如此循环,就能把所有丢帧时主线程的调用栈记录下来。

结语

下一篇《GT3.1 简化您的App性能测试(3)——原理讲解,溯本求源续》,GT君将继续为大家讲解页面启动时长维度、布局的构建与绘制维度、数据库操作维度的实现原理。

项目开源地址:

https://github.com/Tencent/GT

如果您有好的建议,可以留言给我们,谢谢!

版权所属,禁止转载!

原文发布于微信公众号 - 腾讯移动品质中心TMQ(gh_2052d3e8c27d)

原文发表时间:2018-03-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算教程系列

如何在CVM上安装R

R是一种开源编程语言,专门用于统计计算和图形绘制。R在统计的基础下,被广泛用于开发统计软件和数据分析。R是一种日益流行且可扩展的语言,拥有活跃的社区,为特定的研...

1514
来自专栏机器之心

教程 | 一步步从零开始:使用PyCharm和SSH搭建远程TensorFlow开发环境

选自Medium 作者:Erik Hallström 机器之心编译 参与:机器之心编辑部 一般而言,大型的神经网络对硬件能力有着较高的需求——往往需要强劲的 G...

6146
来自专栏乐沙弥的世界

Oracle AWR特性描述

AWR是Automatic Workload Repository的简称,中文叫着自动工作量资料档案库。既然是仓库,又是保存负载数据,所以保存的是数据库性能相关...

651
来自专栏Java技术分享

redis是个单线程的程序,为什么会这么快呢?

纯内存数据库,如果只是简单的 key-value,内存不是瓶颈。一般情况下,hash 查找可以达到每秒数百万次的数量级。 瓶颈在于网络 IO 上。 根据你测的的...

35210
来自专栏FreeBuf

一则邮件攻击样本分析分享

通过邮件投递病毒文件是网络攻击常用的一种方式,因此防御邮件攻击是每个安全团队都需要重点考虑的内容。中兴通讯每天都会收到数万封外部邮件,为了及时检测每封邮件是否含...

742
来自专栏重庆的技术分享区

服务网格(Service Mesh)及其工具选项概述

原文地址:https://dzone.com/articles/an-overview-of-the-service-mesh-and-its-tooling-...

1583
来自专栏架构师之路

高并发的常见应对方案

一、关于并发 我们说的高并发是什么? 在互联网时代,高并发,通常是指,在某个时间点,有很多个访问同时到来。 高并发,通常关心的系统指标与业务指标? QPS:每秒...

5007
来自专栏Python小白进阶之旅

Python盗号原理-代码实现截屏键盘记录远程发送-不要做坏事-木马外挂学习使用

这年头盗号的从出不穷,不是脱裤就是社工钓鱼。今天呢我们就以前面的几篇技术文章做铺垫,来讲一下python盗号的原理(学习用途,请勿用于违法犯罪),知己知彼方能百...

4648
来自专栏Linyb极客之路

灰度发布方案

灰度发布(又名金丝雀发布)是指在黑与白之间,能够平滑过渡的一种发布方式。在其上可以进行A/B testing,即让一部分用户继续用产品特性A,一部分用户开始用产...

4602
来自专栏CSDN技术头条

Google高性能RPC框架gRPC 1.0.0发布

gRPC是一个高性能、开源、通用的RPC框架,面向移动和HTTP/2设计,是由谷歌发布的首款基于Protocol Buffers的RPC框架。 gRPC基于HT...

1869

扫码关注云+社区