关于PV,流量和带宽(r5笔记第37天)

参加了DTCC归来之后,各大电商技术大牛都会自豪的分享一下自己公司网站的PV,流量等等。当时也是一知半解,回来之后赶紧查了查,也算是扫扫盲。 以下摘自网络中,自己稍稍做了整理,对于PV,流量和带宽的理解,可以分成几个问题可能更加容易理解。 问题1:首先什么是PV, 技术角度讲,1个PV是指从浏览器发出一个对网络服务器的Request,网络服务器接到Request之后,会开始把该Request对应的一个Page(Page就是一个网页)发送到客户端的浏览器上,恭喜,这就是一个Page View 对这个概念从业务上更加细化,就是一个访问者在24小时(0点到24点)内到底看了你网站几个页面。这里需要强调:同一个人浏览你网站同一个页面,不重复计算pv量,点100次也算1次。说白了,pv就是一个访问者打开了你的几个页面。 pv的计算:当一个访问者访问的时候,记录他所访问的页面和对应的IP,然后确定这个IP今天访问了这个页面没有。如果你的网站到了23点,单纯IP有60万条的话,每个访问者平均访问了3个页面,那么pv表的记录就要有180万条。 问题2:假设一个网站流量是4000GByte/月,:这到底是多少的带宽(单位是Mbit/s)?以及这4000GB流量可以支持多少IP访问呢? 首先,你自己算一下你的网站有多少PV(页面访问量,1个独立IP可能有多个PV) 然后我们来算一算4000GB流量,可以支持多少个页面访问量: 假设每个页面请求平均大小是15KB(90%的网站所有页面平均请求大概是15KB),那么 访问10个页面,需要流量150KB 访问100个页面,需要流量1500KB(1.5MB) 访问1000个页面,需要流量15MB 访问1万个页面,需要流量150MB 访问10万个页面,需要流量1500MB(1.5GB) 访问100万个页面,需要流量15GB 访问200万个页面,需要流量30GB 访问2000万个页面,需要流量300GB 访问10000万个页面,需要流量1500GB 访问2600万个页面,需要流量4000GB,就是说,4000GB流量,1个月网站PV可以支持到2600万PV,每天80万PV 如果你的网站每个IP访问5个页面,那么4000GB流量,1个月网站可以支持2600/5=520万IP访问量,即每天17万IP 当然,这还是假设页面平均大小有15KB的情况下,一般来说,我们的网页都会大量用到CSS,JS等缓存的文件,所以,平均一个页面一般在15K以下。比如您现在正在浏览的这个页面,经过gzip压缩处理,只有不到5KB。 小技巧:如果PV很大,建议开启gzip压缩功能,这样可以使得平均页面大小在10KB以内。 以此类推(假设每个页面平均大小是15KB): 500GB流量,每个月可以支持320万PV页面访问量,即每天10万PV 1000GB流量,每个月可以支持660万PV页面访问量,即每天22万PV 2000GB流量,每个月可以支持1300万PV页面访问量,即每天44万PV 问题3:10Mb独享带宽相当于多少流量? 首先要弄清楚10Mb独享带宽,单位是bit,8bit=1byte。和我们电信的ADSL的2Mb带宽是一个单位。 换句话说,我们的2Mb ADSL 最大下载速度是256KB(byte)那么10Mb带宽最大速度就是1250KB(约等于1.3MB)/s 1秒钟最大速度是1.3MB(byte),那么10秒13MB,1分钟13×6=78MB,1小时78×60=4680MB(4.6G) 假设,服务器1天24小时都跑满10Mb的带宽(其实这绝对是不可能的),那总流量就是24×4.6=110GB 总结:服务器1个月30天都跑满10Mb的带宽(其实这绝对是不可能的),那总流量就是30×110=3300GB 实际上,一条带宽1个月平均能跑满50%就很不错了,也就是说,2000GB的固定流量,也比10Mb独享的带宽要好的多。 问题4:除了PV,网站流量还有哪些指标。 以下内容摘自 http://www.cnblogs.com/xudong-bupt/p/3959715.html 2.UV   UV(unique visitor),即独立访客数。指访问某个站点或点击某条新闻的不同访客人数。    一日内访问某个网站或者网页的不同用户数量。    同一个用户对一个网站或者一个网页的多次访问记为贡献一个uv。 3.IP   这里指的IP地址就是给每个连接在互联网上的计算机分配的一个32位ipv4地址。(现在已经有64位地址)   申请公网IP是需要钱的,因此出现了NAT(网络地址转换协议)。   局域网内的本地IP地址可以通过NAT转换为集体的公网的IP地址。这样集体只需要申请少量IP地址,局域网内就可以拥有上百台机器。最典型的应用在公司、网吧,这些单位只有少量的公网IP地址。 4.PR   PR(即PageRank),即网页的级别技术,表示一个网页的重要程度。   级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。 IP/UV/PV的区别与联系 (1)IP可以分析用户的地理位置。 (2)PV访问用户对网页的浏览数量。就行春节回家潮中是名词“人次”。 (3)UV统计不使用IP,因为通过由于NAT的原因,一个IP可能对应很多计算机,一个计算机可能有多个用户登录。可以使用用户名统计。

原文发布于微信公众号 - 杨建荣的学习笔记(jianrong-notes)

原文发表时间:2015-05-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯移动品质中心TMQ的专栏

性能自动化充电、断电之痛​——小松鼠的救赎之路

起因 去年刚来公司,我便接手了腾讯LB这款App的性能测试工作。 当时的性能测试的需求是,采集腾讯LB在“前台导航”“后台导航”等数个场景下的...

2239
来自专栏原创

高并发大容量NoSQL解决方案探索

1548
来自专栏我的小碗汤

Jetbrains家族软件激活方法

IDEA的运行速度非常令人满意,这点尤为重要,Eclipse虽然富有多种插件,看上去似乎可以完成多种功能,但是令人沮丧的是,他的运行速度越来越慢了,逐渐的慢到了...

832
来自专栏杨建荣的学习笔记

今天琢磨的几件事情(r7笔记第74天)

今天在琢磨几件事情,也是和工作相关。 数据灾难切换的几点认识: 在unix中可能会碰到在处理网络问题时,超时时间会远远高于linux的情况,这个时候如果尝试做f...

2994
来自专栏顾宇的研习笔记

一怒之下,我写了一个开源流量测试工具

继一怒之下我写出了 Vivian(详见“测试驱动开发 Nginx 配置”)之后。又在等待客户审批流程的时间里自己写了一个流量测试工具。

1025
来自专栏章鱼的慢慢技术路

游戏开发中的专业术语

本文整理了网络/游戏/编程相关的专业术语,作为游戏开发中的辅助参考资料,后期如果遇到其他的术语还会更新。

2121
来自专栏微服务

全面解读NoSQL数据库Redis的核心技术与应用实践

互联网和Web的蓬勃发展正在改变着我们的世界,随着互联网的不断发展和壮大,企业数据规模越来越大,并发量越来越高,关系数据库无法应对新的负载压力,随着Hadoop...

3656
来自专栏PHP在线

关于PHP程序员解决问题的能力

原文出处: 韩天峰(@韩天峰-Rango) 这个话题老生长谈了,在面试中必然考核的能力中,我个人认为解决问题能力是排第一位的,比学习能力优先级更高。解决问题...

3907
来自专栏私有云搭建

腾讯云服务器+可道云kodexplorer打造企业私有云

公有云越来越疲软,企业用户和个人用户对于公有云的接受度也越来越低。企业用户往往转向私有云盘产品,个人用户往往转向了NAS产品,从而来满足自己对于文件共享和管理的...

7904
来自专栏跨界架构师

分布式系统关注点——「负载均衡」到底该如何实施?

        前面两篇《分布式系统关注点——初识「高可用」》、《分布式系统关注点——仅需这一篇,吃透「负载均衡」妥妥的》看完后,相信大家对实现高可用的思路和负...

1284

扫码关注云+社区